Lời nhận xét từ CEO OpenAI gây ra làn sóng tranh cãi lớn. Trong khi đó, CP Gurnani, cựu Giám đốc Điều hành Tập đoàn CNTT Tech Mahindra, khẳng định đầy tham vọng rằng Ấn Độ sẵn sàng chinh phục AI tạo sinh, theo VentureBeat.
Chuyển nhanh đến đầu năm 2024, Ấn Độ giờ đây đã được biết đến với vô vàn tài năng công nghệ và startup đang trên đà phát triển AI. Điều thú vị là “tay chơi” Ấn Độ đầu tiên thực hiện động thái cụ thể liên quan đến AI không phải là Tech Mahindra mà là ông lớn khác được thành lập bởi Bhavish Aggarwal, chủ sở hữu ứng dụng gọi xe Ola Cabs cạnh tranh với Uber, Krutrim.
Krutrim – trong tiếng Ấn mang nghĩa “nhân tạo” – đã ra mắt mô hình ngôn ngữ lớn (LLM) đầu tiên vào tháng trước, đồng thời lên kế hoạch chi tiết để sớm đưa công nghệ này trở thành xu hướng phổ biến. Một vài người chơi khác, bao gồm Tech Mahindra và Reliance Industries, cũng tham gia cuộc đua, cố gắng bắt kịp cải tiến.
CUỘC ĐUA BẢN ĐỊA HÓA
Mặc dù đa số mô hình nền tảng như dòng GPT từ OpenAI và Llama từ Meta thực hiện khá tốt việc tạo câu trả lời nhanh chóng đáp ứng nhu cầu người dùng, nhưng đôi lúc hệ thống gặp khó khăn khi xử lý truy vấn bằng ngôn ngữ không phải tiếng Anh, đặc biệt là những ngôn ngữ có nguồn tài nguyên đầu vào thấp.
Để giải quyết vấn đề và tăng cường trải nghiệm bản địa hóa, nhiều công ty công nghệ ở một số quốc gia bao gồm Hàn Quốc, Phần Lan và Trung Quốc đã bắt đầu đào tạo các mô hình độc quyền nhằm tăng cường hiện diện của ngôn ngữ địa phương và bối cảnh văn hóa trong dữ liệu đào tạo.
Thách thức tương tự đang cản trở tham vọng AI của Ấn Độ. Tuy nhiên, vấn đề trở nên phức tạp gấp nhiều lần. Nước này là nơi sinh sống của 1,4 tỷ người dân, tương đương gần 18% dân số thế giới và có tới 22 ngôn ngữ được công nhận chính thức, hơn 1.600 phương ngữ chính thức và 19.200 phương ngữ không chính thức. Việc đào tạo mô hình bao gồm tất cả loại hình ngôn ngữ đã là nhiệm vụ khó nhằn - và chắc chắn đòi hỏi nguồn vốn lớn (như CEO Altman đã đề xuất).
Sau khi ra mắt dịch vụ gọi xe và lấn sân sang lĩnh vực xe điện, đại gia công nghệ Ấn Độ Aggarwal đã thành lập Krutrim vào tháng 4/2023 với quyết tâm phục vụ người dân bản địa. Công ty huy động khoản tài trợ 24 triệu USD từ Matrix Partners và đang đào tạo LLM dựa trên 2 nghìn tỷ mã token. Khi ra mắt, mô hình tự tin khẳng định đã trang bị số lượng ngôn ngữ Ấn Độ lớn nhất, gấp 20 lần so với bất kỳ mô hình nào.
“Krutrim vốn được đào tạo mang nhiều đặc tính của người Ấn Độ. Hệ thống tạo ra văn bản phù hợp với văn hóa Ấn Độ”, đại diện công ty nhấn mạnh.
Ở phiên bản hiện tại, mô hình hiểu được 20 ngôn ngữ Ấn Độ và có thể tạo ra câu trả lời dựa trên 10 ngôn ngữ, bao gồm cả tiếng Hindi và tiếng Anh. Theo công ty, hiệu suất trên các ngôn ngữ Ấn Độ đã tốt hơn GPT-4 nhưng chất lượng câu trả lời bằng tiếng Anh vẫn xếp sau (dự kiến sẽ cải thiện trong những tháng tới).
Công ty đang chuyển đổi theo từng giai đoạn và chứng kiến nhiều cột mốc phát triển, bao gồm khả năng hỗ trợ truy vấn bằng tất cả ngôn ngữ Ấn Độ được công nhận chính thức và phiên bản Pro có thể giải quyết vấn đề phức tạp với câu trả lời đa dạng từ văn bản, hình ảnh và giọng nói.
Ngoài mô hình sẽ được cung cấp cho khách hàng doanh nghiệp, Aggarwal đã xây dựng chatbot tương tự ChatGPT cho khách hàng cá nhân Ấn Độ. Tuy nhiên, chatbot vẫn chưa mở cửa rộng rãi cho công chúng ở giai đoạn này. Công ty cũng đang thực hiện R&D về mặt phần cứng trong nỗ lực xây dựng siêu máy tính AI.
CUỘC RƯỢT ĐUỔI TỪ CÁC ĐẠI GIA
Mặc dù vẫn còn phải xem xét mô hình AI từ Krutrim sẽ hoạt động như thế nào trong thực tế khi nhà phát triển và người tiêu dùng bắt đầu sử dụng rộng rãi, Aggarwal đã tự định vị hãng là một trong những công ty Ấn Độ đầu tiên nắm bắt được tất cả khía cạnh trong không gian AI rộng lớn.
Một vài cái tên đáng chú ý khác đang cố gắng đuổi kịp là Tech Mahindra và Reliance Industries của tỷ phú Mukesh Ambani.
Tech Mahindra, dưới sự lãnh đạo của cựu CEO CP Gurnani, đã bắt đầu làm việc trên mô hình ngôn ngữ lớn nguồn mở trong Dự án Indus vào tháng 8/2023 và gần đây đã ra mắt phiên bản thử nghiệm nội bộ.
Sản phẩm dự kiến tung ra thị trường vào tháng 2/2024 và được kỳ vọng sẽ trở thành mô hình LLM tiếng Hindi thuần túy với 539 triệu thông số và hơn 10 tỷ mã thông báo tiếng Hindi. Tất nhiên, không phải tất cả ngôn ngữ tại Ấn Độ đều có sẵn trên nền tảng.
“Trong giai đoạn đầu tiên, chúng tôi sẽ tạo LLM dựa trên ngôn ngữ Hindi và hơn 37 phương ngữ, sau đó cải thiện từng giai đoạn nhằm nạp thêm nhiều ngôn ngữ và phương ngữ khác”, công ty lưu ý trên trang web.
Mặt khác, Reliance Industries, đại gia dẫn đầu làn sóng 4G tại Ấn Độ với thương hiệu Jio và được nhiều nhà đầu tư ủng hộ như Google, Meta và Intel, dường như đang tiến chậm hơn một chút trong cuộc đua AI.
Công ty công bố kế hoạch xây dựng mô hình ngôn ngữ dành riêng cho thị trường Ấn Độ tại Đại hội Cổ đông thường niên năm ngoái. Sau đó, hãng hợp tác với Nvidia kích hoạt siêu chip GH200 với quyết tâm phát triển cơ sở hạ tầng AI mạnh hơn siêu máy tính nhanh nhất Ấn Độ hiện tại. Công ty cũng đang hợp tác với Học viện Công nghệ Ấn Độ (The Indian Institute of Technology - IIT Bombay) nhằm đưa dự án có tên Bharat GPT vào cuộc sống.
Mặc dù không có nhiều thông tin chi tiết được chia sẻ nhưng dường như Reliance có kế hoạch cung cấp GPT trên sản phẩm và dịch vụ hướng tới khách hàng hiện tại, bao gồm cả những sản phẩm và dịch vụ do Jio cung cấp. Không rõ liệu công ty có tung ra chatbot riêng biệt giống như ChatGPT hướng tới người tiêu dùng hay không.
Cùng với Reliance và Tech Mahindra, Sarvam AI có trụ sở tại Bengaluru gần đây đã kêu gọi thành công tài trợ 41 triệu USD, cũng thu hút được sự chú ý đáng kể.
Công ty khởi nghiệp xây dựng mô hình ngôn ngữ Ấn Độ gồm 7 tỷ tham số, dựa trên Llama2 và có kế hoạch ra mắt nền tảng lấy doanh nghiệp làm trung tâm, giúp các công ty ứng dụng AI tổng quát trong vận hành hoạt động dễ dàng.
Corover được Google hậu thuẫn cũng tuyên bố xây dựng một mô hình ngôn ngữ Ấn Độ hỗ trợ 22 ngôn ngữ cho nền tảng dành riêng cho doanh nghiệp.
TRẢI NGHIỆM TUYỆT VỜI HƠN VỚI AI TẠO SINH
Khi hệ sinh thái phát triển, nhiều người chơi xuất hiện và công nghệ dần trưởng thành hơn, các dạng mô hình ngôn ngữ Ấn Độ nguồn mở phức tạp dự kiến sẽ cạnh tranh quyết liệt tại quốc gia tỷ dân. Điều này không chỉ cải thiện quy trình làm việc nội bộ doanh nghiệp mà còn mang đến nhiều ứng dụng thú vị cho các tổ chức hoạt động trên nhiều lĩnh vực khác nhau.
Ví dụ, Tech Mahindra lưu ý LLM thuộc Dự án Indus có thể hỗ trợ phát triển công cụ trợ giúp kỹ thuật số cho hơn 140 triệu nông dân, cung cấp thông tin cần thiết về khoản vay, thuốc trừ sâu và nhiều khía cạnh khác liên quan đến nông nghiệp bằng ngôn ngữ địa phương quen thuộc.
Mô hình cũng có thể hỗ trợ tổ chức chăm sóc sức khỏe và tài chính giải mã giọng điệu phương ngữ địa phương và cung cấp thông tin hữu ích chỉ trong vài giây. Khả năng của AI là vô tận.
Ngoài ra, theo các nhà quan sát, cũng sẽ rất thú vị khi xem xét các mô hình “nội địa" hoạt động như thế nào so với mô hình toàn cầu về mặt hiệu suất, bao gồm đối thủ dẫn đầu thị trường như OpenAI sắp tiến tới phiên bản GPT-4.5 và Google gần đây đã ra mắt loạt mô hình Gemini.