Gemini của Google có gì để cạnh tranh với GPT-4?

Gemini đã vượt qua GPT-4 trong một số bài kiểm tra hiệu suất, bao gồm khả năng xử lý hình ảnh, video, âm thanh…

Gemini đối thủ "đáng gờm" của GPT-4
Gemini đối thủ "đáng gờm" của GPT-4

Google đã chính thức ra mắt Gemini, mô hình AI tiên tiến và tổng quát nhất của Google từ trước đến nay, được đánh giá có khả năng cạnh tranh với GPT-4 của OpenAI.

Theo đó, mô hình Gemini 1.0 được Google được cung cấp dưới ba kích cỡ khác nhau, gồm: Ultra, Pro và Nano. Trong số này, Gemini Ultra mạnh nhất và độ phức tạp cao nhất, có thể xử lý được những tác vụ khó nhất. Pro yếu hơn một chút và có thể dùng để xử lý đa tác vụ, trong khi Nano tập trung nhiều hơn vào khả năng xử lý end-side.

Gemini được thiết kế cho nhiều mục đích sử dụng, từ các tác vụ lớn, toàn diện đến các ứng dụng trên thiết bị di động.

Google công bố, Gemini Ultra đã đạt được số điểm 90% trong MMLU (bộ dữ liệu hiểu ngôn ngữ đa tác vụ quy mô lớn), lần đầu tiên vượt qua các chuyên gia con người. Mô hình này sử dụng kết hợp 57 môn học như toán, vật lý, lịch sử, luật, y học và đạo đức.

Google cũng công bố so sánh với mô hình ngôn ngữ lớn mạnh nhất hiện nay GPT-4 của OpenAI ở nhiều khía cạnh, kết quả cho thấy về mặt xử lý văn bản, ngoài điểm MMLU vượt trội 90% so với 86,4% của GPT-4, điểm của Gemini Ultra ở lý luận, toán học, mã hóa và các khía cạnh khác đều cao hơn GPT-4.

Về đa phương thức, Gemini Ultra vượt trội hơn Chat GPT-4 về khả năng xử lý hình ảnh, video, âm thanh…

Mô hình Gemini đã đạt đến mức đáng kinh ngạc về khả năng suy luận mô hình đa phương thức.

Jeff Dean, người đứng đầu bộ phận trí tuệ nhân tạo của Google

Theo ông Sundar Pichai, CEO Google cho biết, Gemini sẽ mang đến những làn sóng đổi mới và tiến bộ kinh tế mới đồng thời thúc đẩy kiến thức, học tập, sáng tạo và năng suất ở quy mô mà chúng ta chưa từng thấy trước đây. Kỷ nguyên mới của các mô hình này đại diện cho một trong những nỗ lực khoa học và kỹ thuật lớn nhất mà Google đang thực hiện.

Google cho biết, Gemini Ultra hiện đang trong quá trình thử nghiệm về độ an toàn. Gemini Nano là phiên bản dành cho các tác vụ trên thiết bị di động, sẽ được trang bị trên Pixel 8 Pro. Hai phiên bản Gemini này sẽ ra thị trường vào năm sau.

Hiện nay, người dùng đã có thể sử dụng bản Pro trong chatbot Bard. Tuy nhiên, Bard sử dụng Gemini Pro mới hỗ trợ tiếng Anh.

Gemini được xây dựng trên cơ sở của mô hình AI LaMDA của Google, được công bố vào năm 2022. LaMDA là một mô hình ngôn ngữ thực tế có thể tạo văn bản, dịch ngôn ngữ, viết các loại nội dung sáng tạo khác nhau và trả lời câu hỏi một cách đầy đủ thông tin.

Xem thêm

Có thể bạn quan tâm

Khoác “áo công nghệ” cho sản phẩm giám sát sức khoẻ tại nhà

Khoác “áo công nghệ” cho sản phẩm giám sát sức khoẻ tại nhà

Các giải pháp công nghệ trong chăm sóc sức khỏe tại nhà đang ngày càng trở nên thông minh và toàn diện. Việc kết hợp giám sát y tế, thiết bị đeo và robot hỗ trợ để nâng cao hiệu quả điều trị, quản lý bệnh lý và cải thiện chất lượng sống cho người bệnh cũng như người cao tuổi...

Samsung Electronics cán mốc doanh thu lịch sử

Samsung Electronics cán mốc doanh thu lịch sử

Sự phục hồi của giá DRAM và NAND đã đưa “ông lớn” bán dẫn Hàn Quốc bước vào chu kỳ tăng trưởng mới, ghi nhận doanh thu và lợi nhuận hoạt động quý 4/2025 lên mức cao nhất trong lịch sử…