OpenAI ra mắt phiên bản GPT-4, có thể nhận câu hỏi bằng hình ảnh

OpenAI chính thức phát hành phiên bản nâng cấp GPT-4 nhằm giúp ChatGPT hoạt động một cách chính xác và sáng tạo hơn...
phiên bản GPT-4

Trong sự kiện công bố phiên bản GPT-4, Giám đốc điều hành OpenAI Sam Altman cho biết mô hình trí tuệ nhân tạo mới được cải tiến theo hướng đa phương thức, nghĩa là sử dụng hình ảnh cũng như lời nhắc văn bản để thúc đẩy ứng dụng sáng tạo nội dung. 

Đây được coi là công nghệ AI tiên tiến chưa từng có, được đào tạo bằng cách sử dụng phản hồi của con người kết hợp công nghệ học sâu (deep learning) và thể hiện hiệu suất trên nhiều tiêu chuẩn chuyên môn và học thuật khác nhau. 

Công nghệ mới nhất của OpenAI cũng cho thấy sự cải tiến vượt bậc so với phiên bản trước được gọi là GPT-3.5. Phiên bản này có khả năng phản hồi các yêu cầu về nội dung trên 82% so với phiên bản tiền nhiệm và đạt điểm cao hơn 40% trong một số bài kiểm tra về tính thực tế. 

Bên cạnh đó, GPT-4 cũng mang đến tính năng được chờ đón từ lâu, đó là chấp nhận hình ảnh làm đầu (input) vào và đưa ra kết quả văn bản. Ví dụ, bạn có thể sử dụng một hình ảnh bao gồm các nguyên liệu bên trong tủ lạnh và hỏi xem có thể nấu món gì, khi đó GPT-4 sẽ cố gắng đưa ra các công thức sử dụng các nguyên liệu trong hình.

Giáo sư Oren Etzioni tại Viện AI Allen cho biết: “Những cải tiến liên tục và đa chiều hiện nay là rất đáng chú ý. GPT-4 hiện là tiêu chuẩn để đánh giá tất cả các mô hình nền tảng (foundation model)”. 

Mặc dù hai phiên bản có thể có nhiều sự tương đồng trong cuộc trò chuyện thông thường, nhưng những cải tiến rõ rệt nhất của GPT-4 là hiệu năng xử lý mạnh mẽ hơn trong các bài đo Uniform Bar Exam, LSAT (88%), SAT Math (89%), và SAT Evidence-Based Reading & Writing. 

OpenAI cho biết, lưu ý rằng GPT-4 đáng tin cậy hơn, sáng tạo hơn và có thể xử lý nhiều hướng dẫn linh hoạt hơn. Tuy nhiên, OpenAI cũng cảnh báo rằng các hệ thống này vẫn tồn tại nhiều vấn đề giống như các mô hình ngôn ngữ trước đó như thông tin không chính xác, tạo ra nội dung bạo lực và có hại.

Rishi Jaluria, một nhà phân tích tại RBC Capital Markets, cho biết Microsoft chắc chắn sẽ được hưởng lợi từ việc áp dụng GPT-4 vào các công cụ của họ. Trong đó, GPT-4 đang giúp tăng sức mạnh cho công cụ tìm kiếm Bing cũng như kết hợp cùng Microsoft Azure để thiết kế một siêu máy tính phục vụ cho công nghệ học sâu. 

Ở giai đoạn hiện tại, chỉ các thành viên ChatGPT Plus (trả phí hàng tháng) mới sử dụng được tính năng nhập văn bản từ hình ảnh của GPT-4 thông qua ChatGPT, trong khi người dùng thông thường phải chờ thêm một thời gian nữa. Khách hàng cũng có thể trải nghiệm ChatGPT và GPT-4 trong Bing và trình duyệt Edge được Microsoft công bố vào tháng trước. 

OpenAI cũng hé lộ khả năng đưa ra mô hình đăng ký GPT-4 mới cho người dùng tùy thuộc vào phản hồi mà họ nhận được. “Công ty cũng hy vọng một lúc nào đó sẽ cung cấp được số lượng truy vấn GPT-4 miễn phí để những người không có đăng ký cũng có thể dùng thử". 

Ở một diễn biến khác trong thế giới công nghệ, đối thủ cạnh tranh lớn nhất của Microsoft trong cuộc đua AI - Alphabet Inc vào ngày 14/3 đã công bố một "cây đũa thần" cho phần mềm cộng tác có thể soạn thảo hầu như mọi tài liệu, chỉ vài ngày trước khi Microsoft dự kiến sẽ giới thiệu AI cho bộ xử lý Word, có khả năng được cung cấp bởi OpenAI. 

Có thể bạn quan tâm