Hạn chế của ChatGPT và các mô hình Generative AI hiện hành

ChatGPT được thiết kế để tránh đưa ra các phản ứng tiêu cực hoặc gây tổn hại. Nhiều nhà phát triển ứng dụng AI tham gia Resonsible AI, một khuôn khổ trong đó các công ty và cá nhân tham gia vào lĩnh vực AI một cách có trách nhiệm. Những hoạt động thiết kế, phát triển và triển khai AI với mục đích tốt là trao quyền cho nhân viên và doanh nghiệp, đồng thời tác động một cách công bằng đến khách hàng và xã hội. Do đó, ChatGPT sẽ không trả lời một số truy vấn nhất định nếu cảm thấy những câu hỏi đó vì trách nhiệm xã hội khi thực thi AI.

Ngoài ra, chất lượng mà ChatGPT phụ thuộc vào chất lượng đầu vào là một hạn chế đáng kể của ChatGPT. Cách đặt câu hỏi, câu lệnh, lời nhắc (prompt) từ các chuyên gia dẫn đến chất lượng tốt hơn người không biết đặt câu hỏi.

Một nhược điểm khác, vì nó được thiết kế để đưa ra câu trả lời mà mọi người cảm thấy tự nhiên, câu trả lời có thể khiến mọi người tin rằng kết quả đầu ra là chính xác. Nhiều người dùng nhận thấy ChatGPT đôi khi cung cấp thông tin sai lệch, bao gồm cả những thông tin hoàn toàn sai.

Trong một báo cáo vào năm ngoái, công ty đầu tư mạo hiểm Sequoia Capital đánh giá Generative AI có thể tạo ra “hàng nghìn tỷ đô la giá trị kinh tế”. Công ty mẹ của Google, Alphabet Inc. đã phát triển công nghệ LLM của riêng mình trong nhiều năm và được cho là không hài lòng với tiềm năng của Generative AI trong việc hỗ trợ hoạt động kinh doanh dịch vụ tìm kiếm có lợi nhuận khổng lồ của mình.

Cuộc đấu giữa hai chàng khổng lồ

Ngày 23/1/2023 Microsoft tiết lộ việc phân bố khoản đầu tư hàng tỷ USD trong nhiều năm, bao gồm phát triển siêu máy tính và hỗ trợ điện toán đám mây để cố gắng củng cố mối quan hệ với OpenAI. Đây là giai đoạn mới của việc hợp tác giữa Open AI với Microsoft.

Ông Sundar Pichai - Giám đốc điều hành (CEO) của Google (bên trái) và ông Satya Nadella - Giám đốc điều hành Microsoft

Microsoft không công bố số tiền chi tiết. Nhưng theo tin từ Bloomberg, khoản đầu tư này có giá trị lên đến 10 tỷ USD. Người khổng lồ của hệ điều hành Windows cũng kế hoạch tích hợp ChatGPT vào công cụ tìm kiếm Bing để cạnh tranh với Google Search.

Điều này có nghĩa các mô hình ngôn ngữ (LM) có thể vượt qua các công cụ tìm kiếm truyền thống để trở thành nguồn thông tin trực tuyến chính. Điều này đe dọa vị trí của Google trong dịch vụ tìm kiếm, vốn là bá chủ lĩnh vực này trong hai thập kỷ vừa qua.

ChatGPT có phải là mối đe dọa thực sự đối với Google không? Liệu Microsoft có thể lật đổ Google? Người khổng lồ tìm kiếm có chiến lược phù hợp? Công ty nào sẽ chiến thắng chung cuộc? Mô hình ngôn ngữ lớn (LLM) sẽ thay thế cơ chế tìm kiếm (search engine) truyền thống hay là sự bổ sung? Các LLM sẽ cải thiện hoặc làm suy giảm khả năng tìm kiếm ở những khía cạnh nào?

Thời báo New York cho biết ChatGPT là “mã đỏ” (code red) - tình trạng báo động khẩn cấp của Google. Hàng triệu người trên Twitter đã lặp lại cùng một cảm xúc, như George Hotz, đối thủ một thời của Elon Musk, người được Twitter thuê để sửa lỗi tìm kiếm, và  nghỉ việc 5 tuần sau đó tán đồng. 

Công bằng mà nói, các mô hình ngôn ngữ LLM lớn vốn dĩ không phải là siêu máy tính khổng lồ. Nhưng ChatGPT hơi khác. MetaAI's Galactica chắc chắn không đạt được hiệu ứng như ChatGPT. Ứng dụng của nhà cung cấp nạng xã hội Facebook này đã viết các bài tiểu luận bị cáo buộc tán thành chủ nghĩa bài Do Thái… dẫn đến việc Meta AI loại bỏ ứng dụng một cách đột ngột. 

Chính các rào cản mà OpenAI đã tạo ra cơ chế sàng lọc những câu trả lời (response) có tính xúc phạm, gây hại cho con người mà các LLM có thể tạo ra. Cuộc điều tra của Time cho thấy để ChatGPT có thể nhanh chóng đưa ra câu trả lời ấn tượng, OpenAI sử dụng những lao động ở Kenya với mức lương ít ỏi cho công việc kiểm duyệt nội dung.

Gary Marcus, giáo sư khoa học thần kinh ở đại học New York đã thử nghiệm ChatGPT và các ứng dụng Generative AI tương tự như You.com, Rerplexity.ai, Neeva.com nhưng tất cả các mô hình này đều gặp một vấn đề nghiêm trọng gọi là “hallucination” (trạng thái ảo giác như phê thuốc) để chỉ tình trạng các LLM tạo ra các đoạn văn, câu trả lời có vẻ hợp lý và đáng tin nhưng thật ra là sai lầm và bịa đặt.

Cuộc chiến giữa những người khổng lồ do AI vẽ

Sự khác nhau giữa LLM và SE (Search Engine) truyền thống

Công cụ tìm kiếm truyền thống (SE- Search Engine) là cơ sở dữ liệu, tập hợp dữ liệu có tổ chức, được lưu trữ, cập nhật và truy xuất theo ý muốn. Công cụ tìm kiếm là những chỉ mục (index), một dạng cơ sở dữ liệu, kết nối những thứ như từ khóa với URL; được cập nhật nhanh chóng, tăng dần, từng chút một như khi bạn cập nhật số điện thoại trong cơ sở dữ liệu chứa danh bạ của bạn. Tất nhiên, qua hai thập kỷ, cơ sở dữ liệu tìm kiếm của Google là khổng lồ và không có tổ chức nào sánh kịp.

Trong khi, các mô hình ngôn ngữ lớn làm một việc rất khác: chúng là những công cụ dự đoán văn bản, tự đồng điền văn bản (autocomplete). Về cơ bản, những gì LLM học được là mối quan hệ giữa các đoạn văn bản, như từ, cụm từ, thậm chí cả câu. LLM sử dụng các mối quan hệ đó để dự đoán các đoạn văn bản khác. LLM diễn giải những mẩu văn bản đó, gần giống như một từ điển đồng nghĩa nhưng tốt hơn nhiều. LLM sử dụng tìm kiếm ngữ nghĩa (semantic search) và đánh giá sự tương tự giữa các văn bản và cung cấp dự đoán các văn bản tiếp theo sau câu hỏi hay lời nhắc (prompt).

François Chollet, kỹ sư phần mềm và nhà nghiên cứu trí tuệ nhân tạo người Pháp hiện đang làm việc tại Google, người tạo ra thư viện Keras đã chỉ ra những vấn đề tương tự như Gary Marcus đã nêu: “tìm kiếm là vấn đề tìm kiếm, không phải vấn đề tạo dựng (văn bản)”, (search is a search problem, not a generation problem).

Tôi tán thành ý kiến của François Chollet và Gary Marcus. Các LLM không vượt trội hơn các SE. Tuy nhiên, các SE có thể cải thiện đáng kể đến mức những SE không tích hợp các tính năng dựa trên LLM sẽ trở nên lỗi thời và cáo chung.

Tóm lại, trong giai đoạn "đánh giá nghiên cứu" (research preview), việc sử dụng ChatGPT là miễn phí. Người dùng hiện có thể trải nghiệm ứng dụng AI thú vị này. Những phản hồi về các câu trả lời giúp nhà phát triển ứng dụng AI cải thiện việc trả lời và học hỏi từ các lỗi. 

ChatGPT đang được sử dụng như một công cụ hữu hiệu để tạo các bài báo hoặc thậm chí các đề cương dài như tiểu luận hay sách. Đã có kế hoạch thương mại ChatGPT với giá 42 USD một tháng với nhu cầu rất cao. 

Trong khi ChatGPT chính thức được thương mại và chờ đợi phiên bản cải tiến hơn của ChatGPT, chúng ta có thể tích cực sử dụng và phản hồi cho Open AI để cải thiện ChatGPT ngày càng tốt hơn như một công cụ AI hữu hiệu phục vụ con người.

Đào Trung Thành