December 24, 2024 | 15:17 GMT+7

Một số mô hình AI của Trung Quốc đang trên đà bỏ xa đối thủ ở Hoa Kỳ

Sơn Trần

Nhiều chuyên gia trong ngành nhận định, một số mô hình AI của Trung Quốc đang ngày càng phổ biến và dần bắt kịp, thậm chí vượt xa đối thủ ở Hoa Kỳ…

Trung Quốc đang tập trung phát triển mô hình ngôn ngữ lớn (LLM) trong cuộc đua trí tuệ nhân tạo.

Nỗ lực của Trung Quốc trong tham vọng thống trị lĩnh vực trí tuệ nhân tạo (AI) đang ghi nhận kết quả tích cực. Các chuyên gia trong ngành và giới phân tích công nghệ cho biết, mô hình AI của Trung Quốc hiện rất phổ biến và có thể sánh ngang, thậm chí vượt qua các mô hình của Hoa Kỳ về hiệu suất, theo CNBC.

Trí tuệ nhân tạo đã trở thành cuộc chiến mới giữa Hoa Kỳ và Trung Quốc, cả hai quốc gia đều coi đây là công nghệ chiến lược. Washington tiếp tục hạn chế quyền tiếp cận của Trung Quốc đối với vi mạch tiên tiến, được thiết kế nhằm hỗ trợ sức mạnh cho trí tuệ nhân tạo, với lo ngại rằng công nghệ có thể đe dọa an ninh quốc gia Hoa Kỳ.

Chính những lệnh cấm đã thúc đẩy Trung Quốc theo đuổi biện pháp riêng để nâng cao và cải thiện hiệu suất mô hình AI, bao gồm việc sử dụng công nghệ mã nguồn mở và phát triển phần mềm, vi mạch siêu nhanh.

TRUNG QUỐC ĐANG TẠO RA LLM PHỔ BIẾN

Giống như một số công ty hàng đầu Hoa Kỳ trong lĩnh vực này, các công ty AI của Trung Quốc đang phát triển mô hình ngôn ngữ lớn (LLM), được huấn luyện trên lượng dữ liệu khổng lồ và hỗ trợ ứng dụng chatbot.

Tuy nhiên, khác với mô hình của OpenAI, nhiều công ty Trung Quốc đang phát triển mô hình LLM mã nguồn mở, hay còn gọi là mô hình mở, nơi nhà phát triển có thể tải xuống và tuỳ chỉnh cá nhân hoá miễn phí mà không cần cấp phép từ nhà sáng chế.

Trên nền tảng Hugging Face, kho lưu trữ mô hình ngôn ngữ lớn, mô hình AI của Trung Quốc được tải xuống nhiều nhất. Ông Tiezhen Wang, kỹ sư học máy cho biết Qwen - dòng mô hình AI được tạo ra bởi gã khổng lồ thương mại điện tử Alibaba, hiện là mô hình phổ biến nhất trên Hugging Face.

“Qwen đang nhanh chóng trở nên phổ biến nhờ hiệu suất vượt trội trong bài kiểm tra cạnh tranh,” ông Wang cho biết trong email gửi CNBC. Ông nói thêm Qwen có một “mô hình cấp phép rất thuận lợi,” nghĩa là các công ty có thể sử dụng nó mà không cần “xem xét tính pháp lý”.

Qwen có nhiều kích cỡ khác nhau, hay còn gọi là tham số trong thế giới mô hình ngôn ngữ lớn. Mô hình với tham số lớn sẽ mạnh mẽ hơn nhưng có chi phí cao hơn, trong khi mô hình nhỏ hơn có chi phí vận hành thấp hơn.

“Bất kể bạn chọn kích cỡ nào, Qwen đều có thể trở thành một trong những mô hình hiệu suất tốt nhất hiện nay”, ông Wang nhấn mạnh.

Gần đây, công ty khởi nghiệp DeepSeek cũng gây được sự chú ý khi ra mắt mô hình có tên DeepSeek-R1. Công ty cho biết vào tháng trước rằng mô hình R1 của họ có thể cạnh tranh trực tiếp với mô hình o1 của OpenAI — mô hình được thiết kế riêng để suy luận hoặc giải quyết nhiệm vụ phức tạp.

Các công ty này tuyên bố mô hình của họ đủ sức cạnh tranh với mô hình mã nguồn mở khác như Llama của Meta, hay mô hình đóng của OpenAI, xét trên nhiều chức năng khác nhau.

“Trong năm qua, chúng ta đã chứng kiến sự gia tăng của các mã nguồn mở ở Trung Quốc trong lĩnh vực AI với hiệu suất thực sự mạnh mẽ, chi phí thấp và khả năng xử lý cao”, bà Grace Isford, đối tác tại Lux Capital, nhận xét.

TRUNG QUỐC MUỐN MÃ NGUỒN MỞ VƯƠN RA TOÀN CẦU

Mã nguồn mở của công nghệ phục vụ nhiều mục đích, bao gồm thúc đẩy đổi mới sáng tạo khi nhiều nhà phát triển có thể tiếp cận và xây dựng trên đó, cũng như kiến tạo cộng đồng xung quanh sản phẩm.

Không chỉ các công ty Trung Quốc mới ra mắt các mô hình LLM mã nguồn mở. Facebook (nay là Meta), hay công ty khởi nghiệp châu Âu Mistral, cũng phát hành các phiên bản mã nguồn mở từ mô hình AI.

Tuy nhiên, với ngành công nghệ đang ở giữa cuộc chiến địa chính trị Washington - Bắc Kinh, mô hình LLM mã nguồn mở mang lại cho giới công nghệ Trung Quốc một lợi thế khác biệt: cho phép các mô hình này được sử dụng trên toàn cầu.

“Các công ty Trung Quốc muốn thấy mô hình của họ được sử dụng ngoài Trung Quốc, vì vậy đây chắc chắn là hướng đi mà họ mong muốn trở thành ông lớn toàn cầu trong lĩnh vực AI”, ông Paul Triolo, đối tác công ty tư vấn toàn cầu DGA Group, cho hay.

Mặc dù trọng tâm là mô hình AI, nhưng cũng có nhiều cuộc tranh luận xoay quanh những ứng dụng nào sẽ được xây dựng trên đó — và ai sẽ thống trị trong không gian internet toàn cầu trong tương lai.

“Nếu bạn cho rằng mô hình AI tiên tiến này là những nền tảng cơ bản, thì vấn đề là các mô hình này sẽ được sử dụng cho mục đích gì?”, bà Grace Isford từ Lux Capital nói.

Các mô hình AI ngày nay đã được so sánh với hệ điều hành Windows của Microsoft, Android của Google và iOS của Apple, với khả năng chiếm lĩnh thị trường, giống như các công ty này làm trên điện thoại di động và máy tính cá nhân.

Nếu điều này đúng, thì việc xây dựng một LLM thống trị ngày càng trở nên cấp thiết.

“Công ty công nghệ Trung Quốc coi mô hình LLM là trung tâm của các hệ sinh thái công nghệ tương lai”, ông Xin Sun, giảng viên cao cấp về kinh doanh Trung Quốc và Đông Á, Đại học King’s College London, cho biết.

“Mô hình kinh doanh trong tương lai sẽ phụ thuộc vào việc nhà phát triển tham gia vào hệ sinh thái, phát triển ứng dụng mới dựa trên mô hình LLM, thu hút người dùng và dữ liệu, từ đó tạo ra lợi nhuận từ nhiều cách thức khác nhau”, ông Sun nói thêm.

HẠN CHẾ CHIP VÀ TƯƠNG LAI AI CỦA TRUNG QUỐC

Huawei nỗ lực theo đuổi mục tiêu thay thế Nvidia tại Trung Quốc.

Mô hình AI được huấn luyện trên lượng dữ liệu khổng lồ, yêu cầu sức mạnh tính toán lớn. Hiện nay, Nvidia là nhà thiết kế chip hàng đầu cho công nghệ này, được gọi là đơn vị xử lý đồ họa (GPU). Hầu hết công ty AI hàng đầu đều huấn luyện hệ thống của họ trên chip hiệu suất cao nhất của Nvidia - nhưng không phải ở Trung Quốc.

Trong khoảng một năm qua, Hoa Kỳ không ngừng tăng cường lệnh hạn chế xuất khẩu thiết bị bán dẫn và thiết bị chế tạo chip sang Trung Quốc. Điều này có nghĩa là chip tiên tiến của Nvidia không thể xuất khẩu sang Trung Quốc, và công ty này phải tạo ra các vi mạch khác đủ điều kiện để xuất khẩu.

Tuy nhiên, bất chấp những hạn chế, ngành công nghệ Trung Quốc vẫn thành công trong việc ra mắt mô hình AI tiên tiến.

“Các nền tảng công nghệ lớn của Trung Quốc hiện có đủ quyền truy cập vào sức mạnh tính toán để tiếp tục cải tiến mô hình. Điều này là do họ đã tích trữ số lượng lớn GPU của Nvidia và đang tận dụng GPU nội địa từ Huawei và một số công ty khác”, ông Triolo từ DGA Group chia sẻ.

Thực tế, giới công nghệ Trung Quốc đã nỗ lực tạo ra các phương án thay thế khả thi cho Nvidia. Huawei là một trong những công ty tiên phong theo đuổi mục tiêu này, trong khi Baidu và Alibaba đầu tư vào thiết kế chất bán dẫn.

“Tuy nhiên, khoảng cách về phần cứng tiên tiến sẽ ngày càng lớn theo thời gian, đặc biệt là vào năm tới khi Nvidia ra mắt hệ thống dựa trên Blackwell, đã bị hạn chế xuất khẩu sang Trung Quốc”, ông Triolo nói thêm.

Theo các nhà quan sát, Trung Quốc đã “đầu tư một cách có hệ thống và phát triển đồng bộ hạ tầng AI nội địa. Do vậy, việc chip Nvidia có bị cấm ở Trung Quốc hay không sẽ không thể ngăn cản Trung Quốc đầu tư và xây dựng cơ sở hạ tầng của riêng họ, để đào tạo mô hình AI.

Một số mô hình AI của Trung Quốc đang trên đà bỏ xa đối thủ ở Hoa Kỳ

Nhiều chuyên gia trong ngành nhận định, một số mô hình AI của Trung Quốc đang ngày càng phổ biến và dần bắt kịp, thậm chí vượt xa đối thủ ở Hoa Kỳ…

TRUNG QUỐC ĐANG TẠO RA LLM PHỔ BIẾN

TRUNG QUỐC MUỐN MÃ NGUỒN MỞ VƯƠN RA TOÀN CẦU

HẠN CHẾ CHIP VÀ TƯƠNG LAI AI CỦA TRUNG QUỐC

Từ ý tưởng đến thị trường: Hành trình còn bỏ ngỏ của sinh viên khởi nghiệp

Temu, Shein vẫn có niềm tin vào thị trường Hoa Kỳ

Ngành Insurtech 2025: Dòng vốn tăng vọt với sự thống trị của AI

Microsoft dự đoán tương lai 'Frontier Firm' dành cho các doanh nghiệp ứng dụng AI

Giới công nghệ Trung Quốc rục rịch sang Hồng Kông để IPO

Ngành lượng tử cần chuẩn bị kỹ cho ngày ra mắt