Công nghệ AI, đặc biệt AI tạo sinh như mô hình ngôn ngữ lớn, có rất nhiều ứng dụng trong lĩnh vực sản xuất nội dung và báo chí như tổng hợp tin, hỏi đáp, dịch văn bản. Tháng 3/2024, tờ Financial Times ra mắt ứng dụng AI tạo sinh giúp hỏi đáp nội dung được xuất bản trong hai thập kỷ. Tháng 2/2024, BBC thông báo đang thử nghiệm sử dụng AI tạo sinh trong nhiều lĩnh vực như dịch báo, chuyển voice (giọng nói) sang text (văn bản) cho chương trình bình luận thể thao, chatbot cho trợ lý nội dung hay dùng AI tạo sinh để tạo headlines cho các bài báo.
Ở Việt Nam, Tạp chí Kinh tế Việt Nam/VnEconomy đã đi tiên phong trước cả những tờ báo nổi tiếng thế giới khi tháng 3/2023 cho ra mắt chatbot Askonomy giúp bạn đọc hỏi đáp nội dung từ Tạp chí Kinh tế Việt Nam/VnEconomy và một năm sau thì cho ra mắt phiên bản Asknomy mới sử dụng mô hình ngôn ngữ riêng thay cho ChatGPT.
Askonomy được ra mắt vào tháng 3/2023 sau hai tháng phát triển nhanh chóng bởi Actable AI dùng công nghệ RAG (Retrieval Augmented Generation) với nền tảng mô hình ngôn ngữ ChatGPT 3.5. RAG hoạt động bằng cách tìm kiếm nội dung liên quan đến câu hỏi của bạn đọc từ cơ sở dữ liệu, sau đấy chuyển sang mô hình ngôn ngữ để tổng hợp câu trả lời. Như vậy thì Askonomy có thể trả lời nội dung mới nhất và chính xác từ nguồn dữ liệu của Askonomy chứ không dựa vào dữ liệu hạn chế được đào tạo của OpenAI.
Sau đó để tự chủ về công nghệ, giảm chi phí và tăng cường độ chính xác, chúng tôi đã cùng nhau phát triển mô hình ngôn ngữ riêng dựa vào dữ liệu của Tạp chí Kinh tế Việt Nam/VnEconomy. Mô hình ngôn ngữ này nhỏ hơn so với ChatGPT nhiều lần và có thể được triển khai trên server với cấu hình thấp. Server được đặt tại Việt Nam để hoàn toàn đảm bảo độ bảo mật và quyền riêng tư của người dùng.
Điểm khác biệt lớn nhất là dữ liệu được cập nhật liên tục hàng ngày và hàng giờ. Điều này đòi hỏi hệ thống RAG phải cập nhật nội dung liên tục và mô hình ngôn ngữ cũng cần được fine-tune (đào tạo thêm) thường xuyên. Lợi thế là cơ quan báo chí thường có nguồn dữ liệu khá phong phú, dồi dào tạo điều kiện thuận lợi để đào tạo các mô hình AI chuyên biệt.
Việc phát triển Askonomy cũng gặp một số trở lại như dữ liệu tương đối lớn và cập nhật thường xuyên, tuy nhiên, trở ngại lớn nhất là dữ liệu kinh tế khá phức tạp và thay đổi theo thời gian (ví dụ số liệu GDP trong các năm khác nhau). Điều này làm mô hình AI dễ bị nhầm lẫn. Ngoài ra, Askonomy có chức năng vẽ biểu đồ rất đặc trưng. Chức năng này đòi hỏi độ chính xác cao và mô hình ngôn ngữ phải trích xuất được các số liệu này một cách chính xác và đầy đủ. Để giải quyết các vấn đề này đòi hỏi đội ngũ kỹ sư phải fine-tune mô hình ngôn ngữ để có thể xử lý dữ liệu đầu vào lớn (context), mô hình embeddings và mô hình đánh giá liên quan chuyên biệt cho dữ liệu của Tạp chí Kinh tế Việt Nam/VnEconomy.
Điểm may mắn là quá trình làm việc giữa đội ngũ phát triển và Tạp chí Kinh tế Việt Nam/VnEconomy rất chặt chẽ. Chúng tôi phát triển công nghệ và được sự tư vấn, trợ giúp của Tạp chí Kinh tế Việt Nam/VnEconomy để “test” chất lượng mô hình ngôn ngữ. Để đáp ứng nhu cầu của số đông người dùng, chúng tôi cũng đã cùng làm việc với Tạp chí Kinh tế Việt Nam/VnEconomy phát triển một mô hình chuyên cho tiếng Việt. Đó trước tiên là một thách thức, nhưng cũng là cơ hội thú vị. Dữ liệu của Tạp chí Kinh tế Việt Nam/VnEconomy khá lớn, có thể đến hơn một triệu bài báo và các dữ liệu khác nhau. Đảm bảo độ chính xác và phục vụ những câu hỏi có độ phức tạp là một thử thách rất lớn nhưng cũng là một bài toán rất thú vị.
Askonomy hoạt động dựa vào hai cơ chế khá phổ biến.
Cơ chế thứ nhất là mô hình ngôn ngữ lớn, giống như ChatGPT để có thể tổng hợp thông tin thành câu trả lời.
Cơ chế thứ hai là gọi là RAG, nghĩa là dựa vào câu hỏi và tìm kiếm những thông tin liên quan đến câu hỏi.
Sau đó gửi đến mô hình ngôn ngữ để mô hình ngôn ngữ tổng hợp câu trả lời. Kết hợp giữa hai cơ chế này sẽ đảm bảo độ chính xác cho câu trả lời tốt hơn. Tóm lại, Askonomy giải quyết vấn đề “ảo giác” bằng công nghệ RAG và fine-tune với dữ liệu tổng hợp đặc quyền được phát triển bởi Actable AI.
Đúng vậy, công nghệ AI hiện vẫn đang được phát triển mạnh mẽ, tuy nhiên cũng có những giới hạn cần sự đột phá về giải pháp. Askonomy hướng đến độ chính xác 100%, chúng tôi sẽ liên tục cập nhật và phát triển công nghệ của mình để đạt mục tiêu một cách sớm nhất.
Công nghệ AI được fine-tune với công nghệ và dữ liệu chuyên biệt, cộng với nguồn dữ liệu phong phú, chất lượng cao của Tạp chí Kinh tế Việt Nam/VnEconomy là những điểm độc đáo của Askonomy.
Một điểm khác biệt của Askonomy đối với những mô hình ngôn ngữ khác cũng trong tiếng Việt là nó tối ưu cho việc hỏi đáp. Chúng tôi hiểu rằng với một mô hình không quá lớn như ChatGPT hay Gemini thì mô hình ngôn ngữ đó phải được tối ưu cho một lĩnh vực cụ thể rất quan trọng để có thể sánh ngang với những mô hình kia trong một task (nhiệm vụ) riêng về lĩnh vực đó. Ngoài hỏi đáp, chức năng dịch và tóm tắt của Askonomy cũng rất tốt.
Nói về sức mạnh của Askonomy so với một bộ máy tìm kiếm, Askonomy tổng hợp câu trả lời và người dùng có thể đọc được câu trả lời luôn, thay vì phải click vào các kết quả tìm kiếm truyền thống và tự đọc các nội dung, gây mất thời gian cũng như giới hạn giao tiếp, tốc độ xử lý thông tin sẽ bị chậm. Khi có thể giao tiếp trực tiếp với Askonomy, người dùng có thể đọc kết quả real time và đó là một động lực để tìm hiểu sâu hơn những thông tin cần thiết.
Theo hiểu biết của tôi thì số lượng cơ quan báo chí ở Việt Nam ứng dụng AI còn khá hạn chế. Vì vậy, đây là thị trường khá tiềm năng cho lĩnh vực AI trong thời gian tới.
VnEconomy 17/06/2024 12:00
Nội dung bài viết được đăng tải trên Tạp chí Kinh tế Việt Nam số 25-2024 phát hành ngày 17/10/2024. Kính mời Quý độc giả tìm đọc tại đây:
https://postenp.phaha.vn/chi-tiet-toa-soan/tap-chi-kinh-te-viet-nam