June 26, 2024 | 15:44 GMT+7

"Đặt lên bàn cân" ưu và nhược điểm của các chatbot AI hàng đầu thế giới

Sơn Trần

Nhóm phóng viên Yahoo Tech đã thực hiện bài đánh giá, so sánh các chatbot như Meta AI, ChatGPT và Google Gemini ở đa số tác vụ hàng ngày mà người dùng hay sử dụng để đánh giá ưu, nhược điểm và tìm ra chatbot thông minh nhất...

Cuộc cạnh tranh giữa ba công cụ lớn AI của Meta, ChatGPT của Open AI và Gemini của Google ngày càng khốc liệt.
Cuộc cạnh tranh giữa ba công cụ lớn AI của Meta, ChatGPT của Open AI và Gemini của Google ngày càng khốc liệt.

Ngành công nghệ đang chứng kiến sự tiến bộ vượt bậc của các chatbot chỉ trong thời gian ngắn. Nhóm phóng viên Yahoo Tech mới đây đã thực hiện bài đánh giá, so sánh từng công cụ ở đa số tác vụ hàng ngày mà người dùng hay sử dụng. Những lĩnh vực được kiểm tra bao gồm email, toán học, công thức nấu ăn, lập trình và một số nhiệm vụ khác.

Từ đó, bài đánh giá sẽ cho biết chatbot AI nào cung cấp câu trả lời toàn diện, chính xác nhất và trích dẫn nguồn khi cần thiết. Trong bài viết này, tác giả sử dụng ChatGPT phiên bản 4.0.

SOẠN THẢO EMAIL

Thử thách đầu tiên của ba công cụ là viết email theo yêu cầu.
Thử thách đầu tiên của ba công cụ là viết email theo yêu cầu.

Nhiều người dùng bắt đầu sử dụng AI để hỗ trợ công việc văn phòng đơn giản, vì vậy nhóm phóng viên yêu cầu cả ba chatbot AI "viết email đề xuất xin gia hạn dự án".

Mỗi chatbot đều xuất sắc cho ra nội dung email tốt, thể hiện rõ tính trang trọng và chuyên nghiệp. Email đều theo dạng mẫu, nghĩa là sau đó người dùng phải cá nhân hóa và bổ sung thêm thông tin liên quan.

Trong thử thách viết email, Meta AI, ChatGPT và Google Gemini đều đạt điểm tuyệt đối. Tất nhiên, đây là yêu cầu cơ bản và dễ thực hiện nhất.

CUNG CẤP CÔNG THỨC NẤU ĂN

Đối với thử thách này, nhóm yêu cầu ba chatbot "cung cấp công thức nấu ớt". Mỗi công cụ đều cho ra công thức nấu chi tiết, tuy nhiên đã có sự khác biệt.

Điểm khác biệt lớn giữa các chatbot là khả năng trích dẫn nguồn công thức. Cả Meta AI và Gemini đều ghi rõ nguồn công thức ở cuối câu trả lời, đồng thời hiển thị liên kết đến trang web được sử dụng. Thậm chí, Gemini còn cung cấp thêm một vài công thức liên quan ở cuối bài.

Tuy nhiên, ChatGPT hoàn toàn không trích dẫn nguồn, câu trả lời chỉ đơn giản là sao chép toàn bộ công thức từ một trang web không rõ ràng. Liệu công cụ có đạo văn không hay tự nghĩ ra công thức? Nếu vậy, ChatGPT có thể mắc lỗi trong quá trình hướng dẫn nấu ăn, gây rủi ro cho người thực hiện khi không thể kiểm tra lại.

Về tác vụ này, nhóm nghiên cứu sẽ sử dụng Gemini hoặc Meta AI để tìm công thức nấu ăn, vì người dùng có thể theo dõi và xác minh nguồn công thức, từ đó đảm bảo an toàn thực phẩm.

TỔNG HỢP TIN TỨC

Tổng hợp tin tức là một trong các tính năng giúp độc giả tiếp cận thông tin nhanh chóng và tiết kiệm thời gian.
Tổng hợp tin tức là một trong các tính năng giúp độc giả tiếp cận thông tin nhanh chóng và tiết kiệm thời gian.

Nhóm thử nghiệm yêu cầu chatbot "cung cấp danh sách tin tức nổi bật mới nhất trong ngày". Cả ba đều thực hiện khá nhanh khi sao chép tiêu đề với một ít nội dung chung của bài báo. Và một lần nữa, sự khác biệt giữa các chatbot AI nằm ở cách công cụ dẫn nguồn tin.

Cả ChatGPT và Meta AI đều liên kết trực tiếp đến trang tin mà công cụ trích dẫn, trong đó ChatGPT còn hiển thị liên kết của nhiều nguồn sau nội dung tiêu đề. Trong khi đó, Gemini nhắc đến các trang tin khác nhau mà công cụ sử dụng nhưng không đính kèm link.

ChatGPT và Meta AI dường như là chatbot tốt nhất khi thực hiện yêu cầu tổng hợp tin tức. Hai công cụ có liên kết rõ ràng đến nguồn thông tin thay vì lấy từ một trang web không xác định và không trích dẫn.

GIẢI BÀI TẬP TOÁN

Ở thử thách này, tác giả đưa ra hai đề toán học: một đại số và một hình học.

Bài toán thứ nhất là "xác định tất cả các giá trị của biểu thức A³ + B³ + C³ — 3ABC trong đó A, B và C là các số nguyên không âm". Bài toán thứ hai là "cho tam giác ∆ABC, trong đó G là trọng tâm và I là tâm đường tròn nội tiếp. Cho α và β lần lượt là các góc tại đỉnh A và B. Giả sử đoạn thẳng IG song song với AB và β = 2 tan^-1 (1/3). Tìm α".

Trong câu hỏi đại số, cả ba chatbot sử dụng ba phương pháp riêng biệt để giải quyết bài toán và đều cho ra kết quả giống nhau.

Tuy nhiên, chatbot đã gặp không ít khó khăn ở bài toán thứ hai. Ban đầu, ChatGPT giải quyết bài toán khá tốt nhưng đáp án cuối cùng lại không chính xác. Gemini cũng giải quyết bài toán nhưng không đưa ra kết quả cuối cùng. Thay vào đó, công cụ gợi ý lý thuyết và công thức giúp người dùng tự tìm câu trả lời. Chỉ có Meta AI là giải được bài toán, cung cấp kết quả chính xác và các bước rõ ràng.

Nếu bạn đang tìm kiếm chatbot có thể giải bài tập toán học, thì Meta AI là lựa chọn tốt nhất.

KHẢ NĂNG LẬP TRÌNH

Khả năng viết mã của AI gây ra nhiều nỗi lo mất việc.
Khả năng viết mã của AI gây ra nhiều nỗi lo mất việc.

Nhóm phóng viên yêu cầu mỗi chatbot AI lập trình theo đề bài sau:

'Tạo ra phiên bản nâng cấp hơn của trò chơi cờ caro với kích thước 12x12. Trò chơi vẫn sử dụng ký hiệu "x" và "o". Người chơi có thể đặt "x" hoặc "o" vào bất kỳ ô trống nào để ngăn chặn nước đi tiếp theo của đối thủ. Mục tiêu để chiến thắng là trở thành người đầu tiên có ít nhất sáu "x" hoặc "o" trên cùng một hàng, cột hoặc đường chéo trước đối thủ. Lưu ý, người chơi là "x" và người chơi "o" là khác nhau. Hãy lập trình trò chơi này bằng HTML và JavaScript đơn giản. Trò chơi này có tên: Tic-Tac-Go".

Để hoàn thành, mỗi chatbot cần cung cấp mã hoàn chỉnh bằng cả HTML và JavaScript (cấu trúc cơ bản của trang web).

Meta AI và ChatGPT cung cấp chính xác những gì được yêu cầu bằng cả hai ngôn ngữ lập trình. Còn Gemini cho ra kết quả JavaScript nhưng sau đó quyết định thay thế bằng HTML và CSS.

Nếu bạn đang tìm kiếm chatbot AI có thể lập trình thì Meta AI và ChatGPT là lựa chọn phù hợp.

GIẢ LẬP PHỎNG VẤN

Cuối cùng, nhóm phóng viên đề nghị chatbot "thực hiện một buổi phỏng vấn giả định cho vị trí biên tập viên mảng công nghệ tại một cơ quan tạp chí lớn". Với yêu cầu này, mỗi chatbot đều mô phỏng tốt buổi phỏng vấn giữa nhà tuyển dụng và ứng viên. 

Cả ba mô hình giả lập cuộc phỏng vấn theo cách khác nhau, nhưng đều kết thúc với kết quả vui vẻ. Mặc dù người dùng cần bổ sung thêm câu hỏi chi tiết trước khi đưa vào sử dụng thực tế, nhưng đây vẫn là những thông tin giá trị với doanh nghiệp.

 CHATBOT THÔNG MINH NHẤT THEO BÀI TEST

Sau khi kiểm đếm kết quả, về tổng thể Meta AI là chatbot AI tốt nhất. Meta AI có kết quả nhất quán nhất với nhiều yêu cầu khác nhau, giúp công cụ đáng tin cậy hơn so với đối thủ cạnh tranh.

ChatGPT đứng ở vị trí thứ hai bởi tính nhất quán trong câu trả lời khá tốt. Nhóm đánh giá cũng thực hiện thêm so sánh với mô hình cũ 3.5 và nhận thấy có sự cải tiến lớn giữa hai phiên bản. Rõ ràng, OpenAI đang làm tốt qua mỗi bản cập nhật.

Google Gemini xếp cuối bảng bởi công cụ được đánh giá là chatbot AI thiếu nhất quán nhất trong nhóm. Khoảng thời gian ban đầu, khi còn được gọi là Google Bard, công ty đã gặp không ít khó khăn và cho đến ngày nay công cụ vẫn đang cố gắng theo kịp đối thủ.

Attention
The original article is written and published on VnEconomy in Vietnamese only. To read the full article, please use the Google Translate tool below to translate the content into your preferred language.
VnEconomy is not responsible for the translation.

Google translate