Gemini của Google có gì để cạnh tranh với GPT-4?

Gemini đã vượt qua GPT-4 trong một số bài kiểm tra hiệu suất, bao gồm khả năng xử lý hình ảnh, video, âm thanh…

Gemini đối thủ "đáng gờm" của GPT-4
Gemini đối thủ "đáng gờm" của GPT-4

Google đã chính thức ra mắt Gemini, mô hình AI tiên tiến và tổng quát nhất của Google từ trước đến nay, được đánh giá có khả năng cạnh tranh với GPT-4 của OpenAI.

Theo đó, mô hình Gemini 1.0 được Google được cung cấp dưới ba kích cỡ khác nhau, gồm: Ultra, Pro và Nano. Trong số này, Gemini Ultra mạnh nhất và độ phức tạp cao nhất, có thể xử lý được những tác vụ khó nhất. Pro yếu hơn một chút và có thể dùng để xử lý đa tác vụ, trong khi Nano tập trung nhiều hơn vào khả năng xử lý end-side.

Gemini được thiết kế cho nhiều mục đích sử dụng, từ các tác vụ lớn, toàn diện đến các ứng dụng trên thiết bị di động.

Google công bố, Gemini Ultra đã đạt được số điểm 90% trong MMLU (bộ dữ liệu hiểu ngôn ngữ đa tác vụ quy mô lớn), lần đầu tiên vượt qua các chuyên gia con người. Mô hình này sử dụng kết hợp 57 môn học như toán, vật lý, lịch sử, luật, y học và đạo đức.

Google cũng công bố so sánh với mô hình ngôn ngữ lớn mạnh nhất hiện nay GPT-4 của OpenAI ở nhiều khía cạnh, kết quả cho thấy về mặt xử lý văn bản, ngoài điểm MMLU vượt trội 90% so với 86,4% của GPT-4, điểm của Gemini Ultra ở lý luận, toán học, mã hóa và các khía cạnh khác đều cao hơn GPT-4.

Về đa phương thức, Gemini Ultra vượt trội hơn Chat GPT-4 về khả năng xử lý hình ảnh, video, âm thanh…

Mô hình Gemini đã đạt đến mức đáng kinh ngạc về khả năng suy luận mô hình đa phương thức.

Jeff Dean, người đứng đầu bộ phận trí tuệ nhân tạo của Google

Theo ông Sundar Pichai, CEO Google cho biết, Gemini sẽ mang đến những làn sóng đổi mới và tiến bộ kinh tế mới đồng thời thúc đẩy kiến thức, học tập, sáng tạo và năng suất ở quy mô mà chúng ta chưa từng thấy trước đây. Kỷ nguyên mới của các mô hình này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà Google đang thực hiện.

Google cho biết, Gemini Ultra hiện đang trong quá trình thử nghiệm về độ an toàn. Gemini Nano là phiên bản dành cho các tác vụ trên thiết bị di động, sẽ được trang bị trên Pixel 8 Pro. Hai phiên bản Gemini này sẽ ra thị trường vào năm sau.

Hiện nay, người dùng đã có thể sử dụng bản Pro trong chatbot Bard. Tuy nhiên, Bard sử dụng Gemini Pro mới hỗ trợ tiếng Anh.

Gemini được xây dựng trên cơ sở của mô hình AI LaMDA của Google, được công bố vào năm 2022. LaMDA là một mô hình ngôn ngữ thực tế có thể tạo văn bản, dịch ngôn ngữ, viết các loại nội dung sáng tạo khác nhau và trả lời câu hỏi một cách đầy đủ thông tin.

Xem thêm

Có thể bạn quan tâm

"Sống sót" sau Y2K, nhưng thế giới sẽ thế nào sau Q-Day?

"Sống sót" sau Y2K, nhưng thế giới sẽ thế nào sau Q-Day?

Những ngày cuối cùng của năm 1999, cả thế giới chìm trong viễn cảnh đen tối về một ngày tận thế mang tên "Sự cố Y2K". Tất nhiên, đã không có ngày tận thế nào xảy ra. Nhưng, thế giới lại sắp phải đối diện với một hiểm họa khác: Q-Day có thể thực sự sẽ là một ngày tận thế với nhân loại! 

Đi săn kho báu dữ liệu của nền kinh tế giấc ngủ

Đi săn kho báu dữ liệu của nền kinh tế giấc ngủ

Các tập đoàn công nghệ toàn cầu đang tận dụng cơ hội để biến giấc ngủ thành kho báu dữ liệu mới của nền kinh tế số, mở ra thị trường ngách hàng tỷ USD nhưng cũng kéo theo những tranh cãi về quyền riêng tư và áp lực tối ưu hóa con người…

Mẹo dùng ChatGPT miễn phí hiệu quả chẳng kém gì bản trả phí

Mẹo dùng ChatGPT miễn phí hiệu quả chẳng kém gì bản trả phí

Dùng ChatGPT miễn phí không đơn giản như nhiều người nghĩ, bởi phía sau là hàng loạt giới hạn ảnh hưởng trực tiếp đến trải nghiệm sử dụng. Tuy nhiên, nếu biết cách tối ưu, phiên bản này vẫn có thể đáp ứng tốt hầu hết nhu cầu hàng ngày...