KINH DOANH

Công nghệ

Gemini 3 Flash thông minh nhưng vẫn hay bịa chuyện

Dù là một AI mạnh mẽ và nhanh nhẹn, Gemini 3 Flash vẫn thường đưa ra câu trả lời bịa khi gặp thông tin ngoài phạm vi huấn luyện. Điều này phản ánh thách thức chung của các mô hình AI trong việc phân biệt giữa kiến thức thực tế và phỏng đoán...

Đức Anh 23/12/2025 13:35

Gemini 3 Flash được đánh giá là nhanh nhẹn và thông minh. Tuy nhiên, theo một đánh giá gần đây từ nhóm kiểm thử độc lập Artificial Analysis, khi gặp những câu hỏi mà nó thực sự không biết, hiếm gặp hoặc nằm ngoài phạm vi dữ liệu huấn luyện, mô hình gần như luôn cố gắng bịa câu trả lời.

Trong chuẩn đánh giá AA-Omniscience, Gemini 3 Flash đạt 91% ở phần tỷ lệ ảo tưởng. Điều này có nghĩa là trong những trường hợp mà mô hình không có câu trả lời, nó vẫn đưa ra đáp án gần như mọi lúc và những đáp án này hoàn toàn hư cấu.

Vấn đề chatbot AI tạo ra thông tin giả đã tồn tại từ khi chúng ra mắt. Việc biết khi nào nên dừng lại và thừa nhận không biết quan trọng không kém việc biết cách trả lời.

Hiện tại, Gemini 3 Flash của Google chưa thực hiện điều này hiệu quả. Bài kiểm tra nhằm mục đích xác định khả năng phân biệt giữa kiến thức thực tế và phỏng đoán của mô hình.

Thế nhưng, tỷ lệ ảo tưởng cao không có nghĩa là 91% tổng số câu trả lời của Gemini sai. Thay vào đó, con số này cho thấy trong các tình huống mà câu trả lời đúng sẽ là “Tôi không biết”, mô hình đã bịa đáp án đến 91% thời gian. Đây là một sự khác biệt tinh tế nhưng quan trọng, đặc biệt khi Gemini được tích hợp vào các sản phẩm như Google Search.

Kết quả này không làm giảm sức mạnh và tính hữu ích của Gemini 3. Mô hình vẫn đạt hiệu suất cao nhất trong các bài kiểm tra tổng quát, xếp ngang hoặc thậm chí vượt các phiên bản mới nhất của ChatGPT và Claude. Tuy nhiên, mô hình thường tỏ ra quá tự tin trong những tình huống đáng lẽ nên khiêm tốn.

Hiện tượng tự tin quá mức cũng xuất hiện ở các đối thủ của Gemini nhưng điểm khác biệt là Gemini gặp tình trạng này rất thường xuyên trong các tình huống không chắc chắn, nơi không có câu trả lời đúng trong dữ liệu huấn luyện hoặc không có nguồn công khai đáng tin cậy.

Một phần nguyên nhân là các mô hình AI sinh ngôn chủ yếu là công cụ dự đoán từ, việc dự đoán từ mới không đồng nghĩa với việc đánh giá sự thật. Do đó, hành vi mặc định là tạo ra từ mới, ngay cả khi việc thừa nhận không biết sẽ trung thực hơn.

OpenAI đã bắt đầu khắc phục vấn đề này bằng cách huấn luyện các mô hình nhận biết điều chúng không biết và thừa nhận rõ ràng. Đây là một thử thách bởi các mô hình thưởng thường không đánh giá cao việc để trống câu trả lời so với việc trả lời tự tin nhưng sai.

Gemini thường trích dẫn nguồn khi có thể nhưng không phải lúc nào cũng dừng lại khi cần thiết. Điều này không quan trọng nếu mô hình chỉ phục vụ nghiên cứu. Khi trở thành “giọng nói” của nhiều tính năng Google, việc tự tin đưa ra thông tin sai có thể ảnh hưởng lớn.

Ngoài ra, một yếu tố khác liên quan đến thiết kế. Nhiều người dùng mong muốn AI trợ lý phản hồi nhanh và mượt mà nên việc nói “không chắc” hoặc “cần kiểm tra” có thể cảm thấy chậm chạp.

Dẫu vậy, điều này vẫn tốt hơn so với việc bị dẫn dắt sai thông tin. AI sinh ngôn vẫn chưa hoàn toàn đáng tin cậy, do đó việc kiểm tra lại bất kỳ câu trả lời nào từ AI luôn là điều nên làm.

từ khóa :

#Gemini 3 Flash #Gemini 3 #Gemini #Google #AI

Xem thêm

Việc chuyển người dùng từ Assistant sang Gemini sẽ được hoãn đến năm 2026

Quyết định tạm dừng Google Assistant bị hoãn

Minh Hiếu

Google vừa thông báo sẽ hoãn việc chuyển người dùng từ Assistant sang Gemini đến năm 2026. Việc này giúp quá trình nâng cấp diễn ra mượt mà hơn, đồng thời mở cơ hội để người dùng đóng góp phản hồi...

Google đang mở rộng triển khai các tính năng AI Gemini tích hợp sẵn trong Chrome trên phiên bản iOS

Người dùng iPhone và iPad giờ đã có thể trải nghiệm Gemini trên Chrome

Minh Hiếu

Thông tin mới nhất cho biết người dùng iOS và iPadOS giờ đây đã có thể trải nghiệm các công cụ AI cơ bản được tích hợp trực tiếp trong trình duyệt Chrome của Google…

Mới nhất / Công nghệ

Nửa cuối 2026 sẽ là màn bứt phá của smartphone với loạt bom tấn đáng chờ đợi

SCEX Simulator gây "sốt" với cộng đồng nhà đầu tư Việt Nam

SCEX Simulator - sàn giao dịch tài sản mã hóa SACOM “gây sốt”: Hơn 22.000 tài khoản chỉ sau 48 giờ ra mắt

Adobe trở lại tâm điểm tranh cãi trong giới công nghệ

Vì sao mang pin sạc dự phòng lên máy bay ngày càng bị kiểm soát nghiêm ngặt?

Ngành game Việt đứng trước cơ hội bứt phá

Khi AI biết giao tiếp bằng giọng nói, liệu thói quen đọc của con người sẽ dần bị lãng quên?

Redmi K90 Ultra ra mắt với hệ thống tản nhiệt chủ động dành cho game thủ

Những lỗ hổng trong cuộc đua bảo vệ trẻ em trên mạng xã hội

Có thể bạn quan tâm

Cắt băng khánh thành nhà máy đóng tàu Alumax Amsterdam

Khánh thành nhà máy đóng tàu Alumax Amsterdam tại Việt Nam

Phương Linh

Ngày 01/7/2026, nhà máy đóng tàu Alumax Amsterdam có trụ sở tại KCN Thuận Thành, tỉnh Bắc Ninh đã chính thức khánh thành. Sự kiện mở ra bước phát triển mới trong lĩnh vực đóng tàu nhôm công nghệ châu Âu tại Việt Nam.

Sau smartphone, các hãng công nghệ đang hướng tới điều gì?

Minh Hiếu

Trong nhiều năm qua, các hãng công nghệ luôn tìm cách khiến con người tương tác với thiết bị nhiều hơn. Thế nhưng giờ đây, một số lãnh đạo trong ngành lại đang theo đuổi một hướng đi hoàn toàn khác là giảm thời gian nhìn vào màn hình...

Vivo trình làng mẫu điện thoại gập ngang mới

Đức Anh

X Fold 6 được Vivo định vị ở phân khúc điện thoại gập cao cấp với loạt nâng cấp về màn hình, camera, pin và khả năng đa nhiệm phục vụ công việc...

Galaxy A27 có thể là bản nâng cấp đáng quên nhất của Samsung

Đức Anh

Dù được trang bị một số cải tiến về phần cứng, Samsung Galaxy A27 vẫn gây tranh cãi khi đi kèm hàng loạt cắt giảm khó hiểu và mức giá cao hơn thế hệ trước...

iPhone Fold giá càng cao càng có lợi cho... Samsung?

Duy Anh

Apple được dự báo sẽ ra mắt chiếc iPhone màn hình gập đầu tiên với mức giá khoảng 2.500 USD, vô tình giúp điện thoại gập của Samsung trở nên hấp dẫn hơn về giá, nhưng đồng thời cũng mở ra cuộc cạnh tranh khốc liệt mới trên thị trường smartphone cao cấp…

ASUS ra mắt laptop doanh nghiệp ExpertBook Ultra, giá từ 68 triệu đồng

Minh Hiếu

ASUS ExpertBook Ultra là sản phẩm cao cấp nhất của ExpertBook Series. Thiết bị mang sứ mệnh tái định hình chuẩn mực máy tính doanh nghiệp, kết hợp hoàn hảo giữa năng suất trí tuệ nhân tạo tối cao và thiết kế đẳng cấp để nâng tầm vị thế cho mọi nhà điều hành…

Apple chính thức tăng giá MacBook, iPad, Mac Studio: “Cơn lũ” chip nhớ buộc Tim Cook phải nhượng bộ

Thùy Dung

Lần đầu tiên Apple chủ động điều chỉnh giá niêm yết diện rộng, thay vì âm thầm cắt cấu hình thấp như mọi lần trước...

7 tinh chỉnh iPhone giúp giảm xao nhãng và tăng hiệu quả sử dụng mỗi ngày

Minh Hiếu

Không cần ứng dụng bên ngoài hay thao tác phức tạp, chỉ vài tinh chỉnh nhỏ trong Cài đặt cũng đủ để iPhone trở nên dễ dùng hơn, hạn chế xao nhãng và phù hợp hơn với thói quen sử dụng hàng ngày...

Drone giao hàng và taxi bay: Cuộc chơi mới trên “tầng trời thấp”

Ngọc Diệp

Bầu trời dưới 1.000 mét đang trở thành một không gian kinh doanh khi Trung Quốc biến drone và taxi bay từ màn trình diễn công nghệ thành dịch vụ có giá bán, có giấy phép và có khách hàng thật...

Khi người lao động đi nhanh hơn doanh nghiệp trong cuộc đua AI

Nam Phong

Báo cáo Microsoft cho thấy người lao động Việt Nam ứng dụng AI vượt tốc độ tổ chức, đặt ra thách thức về quản trị và cấu trúc doanh nghiệp...

Mặt trái ít ai để ý của những tính năng AI trên điện thoại

Minh Hiếu

Điện thoại ngày nay ngày càng thông minh nhờ AI, nhưng đi kèm đó là những tác động âm thầm đến hiệu suất pin mà không phải lúc nào cũng dễ nhận ra...

PGS.TS.Vũ Văn Tích, Phó Giám đốc Học viện Chiến lược Khoa học và Công nghệ, Bộ Khoa học và Công nghệ

Hệ sinh thái AI mở ra cơ hội cất cánh cho doanh nghiệp Việt Nam

Ngọc Nhi

Chuyển đổi số không chỉ là xu hướng công nghệ mà đang trở thành bài toán chiến lược, đòi hỏi sự tham gia đồng bộ của nhà nước, doanh nghiệp, nhà khoa học và nhà đầu tư...

Bí kíp giúp ảnh chụp bằng điện thoại trông đắt giá hơn hẳn

Đức Anh

Không cần thiết bị đắt tiền hay kỹ năng chuyên nghiệp, chỉ một vài thay đổi nhỏ trong cách chụp và chỉnh ảnh cũng có thể tạo ra khác biệt đáng kể...

TECHWORLD 2026: Thế Giới Di Động đưa AI đến gần hơn với thế hệ trẻ

Lam Anh

Sự kiện Techworld 2026 tại TP.HCM mang đến trải nghiệm công nghệ, AI, thể thao điện tử và các hoạt động cộng đồng, thúc đẩy sáng tạo và phát triển trẻ...

Microsoft trình làng Surface Pro và Surface Laptop thế hệ mới

Minh Hiếu

Microsoft quay trở lại đường đua PC với thế hệ Surface mới, mang đến nâng cấp đồng bộ về hiệu năng và nền tảng. Bộ đôi Surface Pro thế hệ 12 và Surface Laptop thế hệ 8 tiếp tục là tâm điểm trong lần ra mắt này...

ASUS ROG đưa Zephyrus Duo màn hình kép về Việt Nam, giá gần 200 triệu đồng

Nam Phong

Thế hệ laptop ROG Zephyrus 2026 của ASUS cho thấy xu hướng hội tụ giữa trí tuệ nhân tạo, sáng tạo nội dung và hiệu năng di động cao cấp. Nổi bật trong lần ra mắt này là Zephyrus Duo – mẫu laptop màn hình kép đầu tiên trên thế giới có mức giá gần 200 triệu đồng tại thị trường Việt Nam...