OpenAI ra mắt phiên bản GPT-4, có thể nhận câu hỏi bằng hình ảnh

OpenAI chính thức phát hành phiên bản nâng cấp GPT-4 nhằm giúp ChatGPT hoạt động một cách chính xác và sáng tạo hơn...
phiên bản GPT-4

Trong sự kiện công bố phiên bản GPT-4, Giám đốc điều hành OpenAI Sam Altman cho biết mô hình trí tuệ nhân tạo mới được cải tiến theo hướng đa phương thức, nghĩa là sử dụng hình ảnh cũng như lời nhắc văn bản để thúc đẩy ứng dụng sáng tạo nội dung. 

Đây được coi là công nghệ AI tiên tiến chưa từng có, được đào tạo bằng cách sử dụng phản hồi của con người kết hợp công nghệ học sâu (deep learning) và thể hiện hiệu suất trên nhiều tiêu chuẩn chuyên môn và học thuật khác nhau. 

Công nghệ mới nhất của OpenAI cũng cho thấy sự cải tiến vượt bậc so với phiên bản trước được gọi là GPT-3.5. Phiên bản này có khả năng phản hồi các yêu cầu về nội dung trên 82% so với phiên bản tiền nhiệm và đạt điểm cao hơn 40% trong một số bài kiểm tra về tính thực tế. 

Bên cạnh đó, GPT-4 cũng mang đến tính năng được chờ đón từ lâu, đó là chấp nhận hình ảnh làm đầu (input) vào và đưa ra kết quả văn bản. Ví dụ, bạn có thể sử dụng một hình ảnh bao gồm các nguyên liệu bên trong tủ lạnh và hỏi xem có thể nấu món gì, khi đó GPT-4 sẽ cố gắng đưa ra các công thức sử dụng các nguyên liệu trong hình.

Giáo sư Oren Etzioni tại Viện AI Allen cho biết: “Những cải tiến liên tục và đa chiều hiện nay là rất đáng chú ý. GPT-4 hiện là tiêu chuẩn để đánh giá tất cả các mô hình nền tảng (foundation model)”. 

Mặc dù hai phiên bản có thể có nhiều sự tương đồng trong cuộc trò chuyện thông thường, nhưng những cải tiến rõ rệt nhất của GPT-4 là hiệu năng xử lý mạnh mẽ hơn trong các bài đo Uniform Bar Exam, LSAT (88%), SAT Math (89%), và SAT Evidence-Based Reading & Writing. 

OpenAI cho biết, lưu ý rằng GPT-4 đáng tin cậy hơn, sáng tạo hơn và có thể xử lý nhiều hướng dẫn linh hoạt hơn. Tuy nhiên, OpenAI cũng cảnh báo rằng các hệ thống này vẫn tồn tại nhiều vấn đề giống như các mô hình ngôn ngữ trước đó như thông tin không chính xác, tạo ra nội dung bạo lực và có hại.

Rishi Jaluria, một nhà phân tích tại RBC Capital Markets, cho biết Microsoft chắc chắn sẽ được hưởng lợi từ việc áp dụng GPT-4 vào các công cụ của họ. Trong đó, GPT-4 đang giúp tăng sức mạnh cho công cụ tìm kiếm Bing cũng như kết hợp cùng Microsoft Azure để thiết kế một siêu máy tính phục vụ cho công nghệ học sâu. 

Ở giai đoạn hiện tại, chỉ các thành viên ChatGPT Plus (trả phí hàng tháng) mới sử dụng được tính năng nhập văn bản từ hình ảnh của GPT-4 thông qua ChatGPT, trong khi người dùng thông thường phải chờ thêm một thời gian nữa. Khách hàng cũng có thể trải nghiệm ChatGPT và GPT-4 trong Bing và trình duyệt Edge được Microsoft công bố vào tháng trước. 

OpenAI cũng hé lộ khả năng đưa ra mô hình đăng ký GPT-4 mới cho người dùng tùy thuộc vào phản hồi mà họ nhận được. “Công ty cũng hy vọng một lúc nào đó sẽ cung cấp được số lượng truy vấn GPT-4 miễn phí để những người không có đăng ký cũng có thể dùng thử". 

Ở một diễn biến khác trong thế giới công nghệ, đối thủ cạnh tranh lớn nhất của Microsoft trong cuộc đua AI - Alphabet Inc vào ngày 14/3 đã công bố một "cây đũa thần" cho phần mềm cộng tác có thể soạn thảo hầu như mọi tài liệu, chỉ vài ngày trước khi Microsoft dự kiến sẽ giới thiệu AI cho bộ xử lý Word, có khả năng được cung cấp bởi OpenAI. 

Xem thêm

Có thể bạn quan tâm

Cuộc khủng hoảng gạo tại Nhật Bản

Cuộc khủng hoảng gạo tại Nhật Bản

Giá gạo tại Nhật Bản liên tục tăng cao do sản lượng sụt giảm và làn sóng quá tải khách du lịch. Những yếu tố này đang đẩy chi phí tiêu dùng lên mức kỷ lục, đồng thời gây áp lực lớn lên chuỗi cung ứng thực phẩm địa phương…

"Cơn ác mộng kép" của bất động sản Trung Quốc: Suy thoái kéo dài và dân số suy giảm

"Cơn ác mộng kép" của bất động sản Trung Quốc: Suy thoái kéo dài và dân số suy giảm

Thị trường bất động sản Trung Quốc đang đối mặt với thách thức chồng chất thách thức, khi dân số sụt giảm mạnh, thu nhập đình trệ và lượng nhà tồn kho khổng lồ. Những yếu tố này liên tục giáng đòn mạnh vào tâm lý của cả người mua nhà lẫn các nhà đầu tư, khiến triển vọng phục hồi trở nên mờ mịt…

Iran đóng cửa eo biển Hormuz: Hơn 1/5 lượng dầu thế giới có thể bị đóng băng, giá dầu sẽ vượt 100 USD/thùng

Iran đóng cửa eo biển Hormuz: Hơn 1/5 lượng dầu thế giới có thể bị đóng băng, giá dầu sẽ vượt 100 USD/thùng

Quốc hội Iran vừa thông qua nghị quyết cho phép đóng cửa eo biển Hormuz - tuyến hàng hải huyết mạch với hơn 1/5 lượng dầu mỏ thế giới được vận chuyển qua mỗi ngày. Động thái này làm dấy lên những lo ngại sâu sắc về sự ổn định của thị trường năng lượng toàn cầu và các tuyến đường vận chuyển quốc tế…

Fed giữ nguyên lãi suất, "hé lộ" 2 lần cắt giảm trong năm nay

Fed giữ nguyên lãi suất, "hé lộ" 2 lần cắt giảm trong năm nay

Cục Dự trữ Liên bang Mỹ (Fed) quyết định giữ nguyên lãi suất trong bối cảnh nền kinh tế được dự báo sẽ đối mặt với lạm phát cao hơn và tốc độ tăng trưởng chậm lại. Dù vậy, Fed vẫn dự kiến sẽ tiến hành hai lần cắt giảm lãi suất trong năm 2025…

Xung đột Trung Đông đẩy Fed vào thế khó

Xung đột Trung Đông đẩy Fed vào thế khó

Căng thẳng leo thang giữa Israel và Iran khiến giá dầu tăng vọt, làm dấy lên lo ngại lạm phát toàn cầu và có thể buộc Cục Dự trữ Liên bang Mỹ (Fed) phải tiếp tục trì hoãn kế hoạch cắt giảm lãi suất…