Gemini của Google có gì để cạnh tranh với GPT-4?

Gemini đã vượt qua GPT-4 trong một số bài kiểm tra hiệu suất, bao gồm khả năng xử lý hình ảnh, video, âm thanh…

Gemini đối thủ "đáng gờm" của GPT-4

Google đã chính thức ra mắt Gemini, mô hình AI tiên tiến và tổng quát nhất của Google từ trước đến nay, được đánh giá có khả năng cạnh tranh với GPT-4 của OpenAI.

Theo đó, mô hình Gemini 1.0 được Google được cung cấp dưới ba kích cỡ khác nhau, gồm: Ultra, Pro và Nano. Trong số này, Gemini Ultra mạnh nhất và độ phức tạp cao nhất, có thể xử lý được những tác vụ khó nhất. Pro yếu hơn một chút và có thể dùng để xử lý đa tác vụ, trong khi Nano tập trung nhiều hơn vào khả năng xử lý end-side.

Gemini được thiết kế cho nhiều mục đích sử dụng, từ các tác vụ lớn, toàn diện đến các ứng dụng trên thiết bị di động.

Google công bố, Gemini Ultra đã đạt được số điểm 90% trong MMLU (bộ dữ liệu hiểu ngôn ngữ đa tác vụ quy mô lớn), lần đầu tiên vượt qua các chuyên gia con người. Mô hình này sử dụng kết hợp 57 môn học như toán, vật lý, lịch sử, luật, y học và đạo đức.

Google cũng công bố so sánh với mô hình ngôn ngữ lớn mạnh nhất hiện nay GPT-4 của OpenAI ở nhiều khía cạnh, kết quả cho thấy về mặt xử lý văn bản, ngoài điểm MMLU vượt trội 90% so với 86,4% của GPT-4, điểm của Gemini Ultra ở lý luận, toán học, mã hóa và các khía cạnh khác đều cao hơn GPT-4.

Về đa phương thức, Gemini Ultra vượt trội hơn Chat GPT-4 về khả năng xử lý hình ảnh, video, âm thanh…

Mô hình Gemini đã đạt đến mức đáng kinh ngạc về khả năng suy luận mô hình đa phương thức.

Jeff Dean, người đứng đầu bộ phận trí tuệ nhân tạo của Google

Theo ông Sundar Pichai, CEO Google cho biết, Gemini sẽ mang đến những làn sóng đổi mới và tiến bộ kinh tế mới đồng thời thúc đẩy kiến thức, học tập, sáng tạo và năng suất ở quy mô mà chúng ta chưa từng thấy trước đây. Kỷ nguyên mới của các mô hình này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà Google đang thực hiện.

Google cho biết, Gemini Ultra hiện đang trong quá trình thử nghiệm về độ an toàn. Gemini Nano là phiên bản dành cho các tác vụ trên thiết bị di động, sẽ được trang bị trên Pixel 8 Pro. Hai phiên bản Gemini này sẽ ra thị trường vào năm sau.

Hiện nay, người dùng đã có thể sử dụng bản Pro trong chatbot Bard. Tuy nhiên, Bard sử dụng Gemini Pro mới hỗ trợ tiếng Anh.

Gemini được xây dựng trên cơ sở của mô hình AI LaMDA của Google, được công bố vào năm 2022. LaMDA là một mô hình ngôn ngữ thực tế có thể tạo văn bản, dịch ngôn ngữ, viết các loại nội dung sáng tạo khác nhau và trả lời câu hỏi một cách đầy đủ thông tin.

Có thể bạn quan tâm