Gemini của Google có gì để cạnh tranh với GPT-4?

Gemini đã vượt qua GPT-4 trong một số bài kiểm tra hiệu suất, bao gồm khả năng xử lý hình ảnh, video, âm thanh…

Gemini đối thủ "đáng gờm" của GPT-4
Gemini đối thủ "đáng gờm" của GPT-4

Google đã chính thức ra mắt Gemini, mô hình AI tiên tiến và tổng quát nhất của Google từ trước đến nay, được đánh giá có khả năng cạnh tranh với GPT-4 của OpenAI.

Theo đó, mô hình Gemini 1.0 được Google được cung cấp dưới ba kích cỡ khác nhau, gồm: Ultra, Pro và Nano. Trong số này, Gemini Ultra mạnh nhất và độ phức tạp cao nhất, có thể xử lý được những tác vụ khó nhất. Pro yếu hơn một chút và có thể dùng để xử lý đa tác vụ, trong khi Nano tập trung nhiều hơn vào khả năng xử lý end-side.

Gemini được thiết kế cho nhiều mục đích sử dụng, từ các tác vụ lớn, toàn diện đến các ứng dụng trên thiết bị di động.

Google công bố, Gemini Ultra đã đạt được số điểm 90% trong MMLU (bộ dữ liệu hiểu ngôn ngữ đa tác vụ quy mô lớn), lần đầu tiên vượt qua các chuyên gia con người. Mô hình này sử dụng kết hợp 57 môn học như toán, vật lý, lịch sử, luật, y học và đạo đức.

Google cũng công bố so sánh với mô hình ngôn ngữ lớn mạnh nhất hiện nay GPT-4 của OpenAI ở nhiều khía cạnh, kết quả cho thấy về mặt xử lý văn bản, ngoài điểm MMLU vượt trội 90% so với 86,4% của GPT-4, điểm của Gemini Ultra ở lý luận, toán học, mã hóa và các khía cạnh khác đều cao hơn GPT-4.

Về đa phương thức, Gemini Ultra vượt trội hơn Chat GPT-4 về khả năng xử lý hình ảnh, video, âm thanh…

Mô hình Gemini đã đạt đến mức đáng kinh ngạc về khả năng suy luận mô hình đa phương thức.

Jeff Dean, người đứng đầu bộ phận trí tuệ nhân tạo của Google

Theo ông Sundar Pichai, CEO Google cho biết, Gemini sẽ mang đến những làn sóng đổi mới và tiến bộ kinh tế mới đồng thời thúc đẩy kiến thức, học tập, sáng tạo và năng suất ở quy mô mà chúng ta chưa từng thấy trước đây. Kỷ nguyên mới của các mô hình này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà Google đang thực hiện.

Google cho biết, Gemini Ultra hiện đang trong quá trình thử nghiệm về độ an toàn. Gemini Nano là phiên bản dành cho các tác vụ trên thiết bị di động, sẽ được trang bị trên Pixel 8 Pro. Hai phiên bản Gemini này sẽ ra thị trường vào năm sau.

Hiện nay, người dùng đã có thể sử dụng bản Pro trong chatbot Bard. Tuy nhiên, Bard sử dụng Gemini Pro mới hỗ trợ tiếng Anh.

Gemini được xây dựng trên cơ sở của mô hình AI LaMDA của Google, được công bố vào năm 2022. LaMDA là một mô hình ngôn ngữ thực tế có thể tạo văn bản, dịch ngôn ngữ, viết các loại nội dung sáng tạo khác nhau và trả lời câu hỏi một cách đầy đủ thông tin.

Xem thêm

Có thể bạn quan tâm

AI - “Nhân đôi áp lực” hay “chìa khoá vạn năng”?

AI - “Nhân đôi áp lực” hay “chìa khoá vạn năng”?

Khi cơ sở hạ tầng đang bước vào giai đoạn chuyển dịch mạnh mẽ thì trí tuệ nhân tạo (AI) có thể nhân đôi áp lực hoặc trở thành chìa khoá giải quyết các vấn đề - Điều này phụ thuộc rất nhiều vào sự thích ứng của doanh nghiệp trước thời cuộc...

Tính đến giữa năm 2025, thị trường tài sản mã hóa toàn cầu đã vượt mốc 2.000 tỷ USD

Thị trường tài sản mã hóa: Thí điểm để khai mở tương lai

Trong hành trình kiến tạo một nền kinh tế số hiện đại, việc Chính phủ giao Bộ Tài chính chủ trì, khẩn trương xây dựng và trình dự thảo Nghị quyết về thí điểm thị trường tài sản mã hóa là một bước đi vừa táo bạo, vừa rất cần thiết...

Các đại biểu thảo luận tại diễn đàn

Thời điểm bản lề để Việt Nam “chuyển mình” sang quốc gia sản xuất công nghệ cao

Nhận định này được đa số các đại biểu đưa ra tại Diễn đàn Công nghiệp sản xuất M-TALKS 2025 diễn ra ngày 2/7, tại Hà Nội trong bối cảnh địa chính trị và công nghệ toàn cầu biến động, Việt Nam đang từng bước chuyển mình từ “công xưởng sản xuất” trở thành trung tâm sáng tạo công nghệ cao của khu vực..