CEO OpenAI Sam Altman từng chia sẻ rằng sẽ rất hữu ích nếu có một dịch vụ vừa theo dõi hoạt động hàng ngày của người dùng vừa chủ động hỗ trợ khi cần. Ý tưởng này chính là nền tảng cho các trình duyệt AI mới, điển hình là ChatGPT Atlas của OpenAI và Comet của Perplexity.
Khác với trình duyệt truyền thống, trình duyệt AI có ít nhất hai điểm nổi bật. Một nút ở góc trên bên phải màn hình giúp gọi ra chatbot, cho phép người dùng đặt câu hỏi về nội dung đang xem, ví dụ làm rõ bài viết hoặc giải thích hình ảnh.
Bên cạnh đó, chế độ agent cho phép AI thực hiện các tác vụ thay người dùng như chỉnh sửa Google Docs hoặc mua sắm trên Amazon.
Tuy tiện lợi nhưng trình duyệt AI cũng tiềm ẩn rủi ro về quyền riêng tư. Lena Cohen, chuyên gia tại Electronic Frontier Foundation, cho biết Atlas có khả năng truy cập nhiều thông tin hơn các trình duyệt khác và dữ liệu này có thể được sử dụng để huấn luyện các mô hình của OpenAI.
Khi trả lời câu hỏi về một trang web, trình duyệt AI sẽ gửi dữ liệu cá nhân từ trang đó lên máy chủ. Ví dụ như lịch sử đơn hàng trên Amazon hoặc tin nhắn trên WhatsApp. Trong khi đó, trình duyệt truyền thống không có AI chỉ lưu danh sách URL mà không nhìn thấy nội dung đang truy cập.
Or Eshed, CEO của LayerX, nền tảng bảo mật trình duyệt, nhận định rằng trình duyệt AI giống như một “mỏ vàng khai thác dữ liệu người dùng ngay trong trình duyệt”. Do vậy, cần lưu ý một số điều trước khi quyết định giao việc duyệt web cho AI.
CẨN TRỌNG VỚI DỮ LIỆU
Khi truy cập chatbot qua thanh bên trình duyệt, dữ liệu mà AI nhận được khó kiểm soát hơn so với khi sử dụng trực tiếp trên website vì thanh bên tự động gắn kèm trang web đang xem để làm bối cảnh.
OpenAI cho biết, dữ liệu thu thập sẽ khác nhau tùy nội dung. Theo Pranav Vishnu, trưởng nhóm sản phẩm Atlas, mô hình AI nhìn chung có khả năng xác định thông tin cần lấy.
Nếu đang xem hình ảnh, AI có thể lấy ảnh trên trang, còn khi đọc bài viết, mô hình thường chỉ lấy phần văn bản. Chức năng bộ nhớ trình duyệt tùy chọn trong Atlas còn lưu mô tả tất cả các trang đã truy cập, thay vì chỉ gửi trang đang mở cho ChatGPT.
Người dùng không thể biết chính xác phần nào của website được AI thu thập hay cách AI quyết định dữ liệu cần thiết. Để tăng an toàn, Atlas cho phép loại bỏ một trang khỏi cửa sổ chat bằng cách nhấn “x” khi rê chuột vào tên trang hoặc chặn một số website không được gửi dữ liệu cho ChatGPT thông qua cài đặt trên thanh URL.
Trong khi đó, Perplexity không có các tùy chọn này. Để tránh việc dữ liệu nhạy cảm bị gửi đi, nên mở một tab mới với nội dung an toàn và truy cập thanh bên tại tab đó vì Perplexity chỉ đính dữ liệu của tab đang mở vào cuộc trò chuyện.
TẮT HUẤN LUYỆN AI
Atlas cung cấp hai tùy chọn liên quan đến huấn luyện mô hình. Tùy chọn “cải thiện mô hình cho mọi người” cho phép OpenAI sử dụng mọi dữ liệu gửi cho ChatGPT để huấn luyện, mặc định được bật.
Vì Atlas tự động đính kèm website khi đặt câu hỏi, dữ liệu cá nhân từ các trang như mạng xã hội cũng có thể bị sử dụng. OpenAI cho biết họ sẽ loại bỏ dữ liệu cá nhân trước khi huấn luyện nhưng không nêu rõ cách xác định dữ liệu nào là cá nhân.
Tùy chọn thứ hai là “bao gồm hoạt động duyệt web” cho phép OpenAI huấn luyện dựa trên các tab đang mở, các liên kết đã click, nói chung là toàn bộ hoạt động duyệt web. May mắn là tùy chọn này mặc định tắt.
Cách an toàn nhất là tắt hoàn toàn “cải thiện mô hình cho mọi người”. Điều này sẽ ngăn AI sử dụng dữ liệu chat hoặc dữ liệu duyệt web để huấn luyện. Trong khi đó, Perplexity lưu dữ liệu từ Comet trực tiếp trên máy tính người dùng và có thể tắt việc lưu trữ dữ liệu trong phần “Preferences” của tài khoản.
Để tắt tính năng trên, bạn nhấp vào hình đại diện của tài khoản rồi chọn kiểm soát dữ liệu. Sau đó ấn tắt “cải thiện mô hình cho mọi người” là hoàn tất.
QUYỀN KIỂM SOÁT DỮ LIỆU HẠN CHẾ
Cần lưu ý rằng, ngay cả khi lựa chọn không tham gia vào quá trình huấn luyện mô hình, dữ liệu vẫn có thể được gửi lên máy chủ. Việc này chỉ giới hạn khả năng sử dụng dữ liệu để huấn luyện mà thôi.
Lena Cohen, chuyên gia tại Electronic Frontier Foundation, cảnh báo rằng khi dữ liệu nhạy cảm đã được lưu trên máy chủ của một công ty khác, quyền kiểm soát gần như không còn.
Dữ liệu này có thể bị sử dụng hoặc lạm dụng theo những cách mà hầu hết người dùng không lường trước được từ các hành vi xâm nhập của hacker đến các yêu cầu từ chính phủ.
Thực tế cho thấy, chỉ trong khoảng thời gian từ tháng 1 đến tháng 6 năm 2025, OpenAI đã tuân thủ 105 yêu cầu cung cấp dữ liệu người dùng từ chính phủ Mỹ, minh chứng cho việc dữ liệu cá nhân có thể được truy cập ngoài tầm kiểm soát của người sở hữu.
HIỂM HỌA TỪ CÁC CUỘC TẤN CÔNG HỆ THỐNG
Khi trình duyệt AI được ra mắt, đã xuất hiện các cảnh báo về nguy cơ agent bị chiếm quyền, chẳng hạn như đánh cắp dữ liệu ngân hàng.
Các cuộc tấn công kiểu “prompt injection” lợi dụng điểm hạn chế của AI trong việc phân biệt nội dung trang web và các chỉ dẫn cần thực hiện. Kẻ tấn công có thể giấu các chỉ dẫn độc hại trong trang web mà người dùng không thể nhìn thấy nhưng AI vẫn đọc và thực hiện theo.
Or Eshed, CEO của LayerX, khuyến nghị nên thận trọng khi kích hoạt chế độ agent trên những trang web không quen thuộc vì không phải mối đe dọa nào cũng dễ nhận biết ngay.
Để giảm nguy cơ, Atlas cung cấp hai chế độ là đăng nhập và đăng xuất. Ở chế độ đăng xuất, agent không có quyền truy cập dữ liệu cá nhân hay tài khoản, từ đó hạn chế nguy cơ rò rỉ thông tin.
Trong khi đó, Perplexity không có tùy chọn này khiến chế độ agent tiềm ẩn rủi ro cao hơn. Pranav Vishnu, trưởng nhóm sản phẩm Atlas, nhận xét rằng agentic browsing vẫn là một lĩnh vực mới và đang phát triển. Vì vậy, nên bắt đầu với chế độ đăng xuất, chỉ cấp quyền cần thiết cho từng nhiệm vụ cụ thể.
ĐƠN GIẢN NHẤT LÀ… KHÔNG DÙNG
Việc AI thâm nhập sâu vào đời sống người dùng là một phần chiến lược quan trọng của các công ty công nghệ. Tuy nhiên, với trình duyệt AI, người dùng hoàn toàn có thể lựa chọn từ chối sử dụng.
Dan Hendrycks, giám đốc Trung tâm An toàn AI, nhận định học máy chủ yếu khai thác dữ liệu. Việc mở rộng AI vào các lĩnh vực mới có thể mang lại hiệu quả lớn. Duyệt web bằng AI là một trong những lĩnh vực tiềm năng như vậy.
Các công ty AI mong muốn gia nhập thị trường sớm để thu thập dữ liệu nhiều hơn so với đối thủ. Từ đó cải thiện sản phẩm nhanh hơn, tạo hiệu ứng thu hút người dùng và cuối cùng tăng doanh thu. Hendrycks còn chia sẻ một cách hài hước rằng ChatGPT Atlas tự quảng cáo liên tục, khiến ông không mấy hứng thú tải về sử dụng.