Gemini của Google có gì để cạnh tranh với GPT-4?

Gemini đã vượt qua GPT-4 trong một số bài kiểm tra hiệu suất, bao gồm khả năng xử lý hình ảnh, video, âm thanh…

Gemini đối thủ "đáng gờm" của GPT-4
Gemini đối thủ "đáng gờm" của GPT-4

Google đã chính thức ra mắt Gemini, mô hình AI tiên tiến và tổng quát nhất của Google từ trước đến nay, được đánh giá có khả năng cạnh tranh với GPT-4 của OpenAI.

Theo đó, mô hình Gemini 1.0 được Google được cung cấp dưới ba kích cỡ khác nhau, gồm: Ultra, Pro và Nano. Trong số này, Gemini Ultra mạnh nhất và độ phức tạp cao nhất, có thể xử lý được những tác vụ khó nhất. Pro yếu hơn một chút và có thể dùng để xử lý đa tác vụ, trong khi Nano tập trung nhiều hơn vào khả năng xử lý end-side.

Gemini được thiết kế cho nhiều mục đích sử dụng, từ các tác vụ lớn, toàn diện đến các ứng dụng trên thiết bị di động.

Google công bố, Gemini Ultra đã đạt được số điểm 90% trong MMLU (bộ dữ liệu hiểu ngôn ngữ đa tác vụ quy mô lớn), lần đầu tiên vượt qua các chuyên gia con người. Mô hình này sử dụng kết hợp 57 môn học như toán, vật lý, lịch sử, luật, y học và đạo đức.

Google cũng công bố so sánh với mô hình ngôn ngữ lớn mạnh nhất hiện nay GPT-4 của OpenAI ở nhiều khía cạnh, kết quả cho thấy về mặt xử lý văn bản, ngoài điểm MMLU vượt trội 90% so với 86,4% của GPT-4, điểm của Gemini Ultra ở lý luận, toán học, mã hóa và các khía cạnh khác đều cao hơn GPT-4.

Về đa phương thức, Gemini Ultra vượt trội hơn Chat GPT-4 về khả năng xử lý hình ảnh, video, âm thanh…

Mô hình Gemini đã đạt đến mức đáng kinh ngạc về khả năng suy luận mô hình đa phương thức.

Jeff Dean, người đứng đầu bộ phận trí tuệ nhân tạo của Google

Theo ông Sundar Pichai, CEO Google cho biết, Gemini sẽ mang đến những làn sóng đổi mới và tiến bộ kinh tế mới đồng thời thúc đẩy kiến thức, học tập, sáng tạo và năng suất ở quy mô mà chúng ta chưa từng thấy trước đây. Kỷ nguyên mới của các mô hình này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà Google đang thực hiện.

Google cho biết, Gemini Ultra hiện đang trong quá trình thử nghiệm về độ an toàn. Gemini Nano là phiên bản dành cho các tác vụ trên thiết bị di động, sẽ được trang bị trên Pixel 8 Pro. Hai phiên bản Gemini này sẽ ra thị trường vào năm sau.

Hiện nay, người dùng đã có thể sử dụng bản Pro trong chatbot Bard. Tuy nhiên, Bard sử dụng Gemini Pro mới hỗ trợ tiếng Anh.

Gemini được xây dựng trên cơ sở của mô hình AI LaMDA của Google, được công bố vào năm 2022. LaMDA là một mô hình ngôn ngữ thực tế có thể tạo văn bản, dịch ngôn ngữ, viết các loại nội dung sáng tạo khác nhau và trả lời câu hỏi một cách đầy đủ thông tin.

Xem thêm

Có thể bạn quan tâm

Xu hướng công nghệ sẽ định hình thế giới trong năm 2026

Xu hướng công nghệ sẽ định hình thế giới trong năm 2026

Năm 2026 hứa hẹn là một bước ngoặt quan trọng của công nghệ khi AI, robot, điện thoại gập, kính thông minh... cùng cạnh tranh để định hình tương lai số. Những xu hướng này không chỉ tác động đến cách chúng ta sử dụng thiết bị mà còn mở ra cơ hội và thách thức mới cho toàn ngành... 

Có thể đổi địa chỉ gmail mà không cần tạo mới?

Có thể đổi địa chỉ gmail mà không cần tạo mới?

Việc thay đổi địa chỉ Gmail từ lâu vốn được xem là điều gần như không thể nếu muốn giữ nguyên dữ liệu và lịch sử sử dụng. Tuy nhiên, những thông tin mới từ Google cho thấy rào cản này có thể sớm được gỡ bỏ…

Gemini 3 Flash thông minh nhưng vẫn hay bịa chuyện

Gemini 3 Flash thông minh nhưng vẫn hay bịa chuyện

Dù là một AI mạnh mẽ và nhanh nhẹn, Gemini 3 Flash vẫn thường đưa ra câu trả lời bịa khi gặp thông tin ngoài phạm vi huấn luyện. Điều này phản ánh thách thức chung của các mô hình AI trong việc phân biệt giữa kiến thức thực tế và phỏng đoán...

Việc chuyển người dùng từ Assistant sang Gemini sẽ được hoãn đến năm 2026

Quyết định tạm dừng Google Assistant bị hoãn

Google vừa thông báo sẽ hoãn việc chuyển người dùng từ Assistant sang Gemini đến năm 2026. Việc này giúp quá trình nâng cấp diễn ra mượt mà hơn, đồng thời mở cơ hội để người dùng đóng góp phản hồi...