Reddit tố Perplexity ăn cắp dữ liệu để dạy AI thông minh hơn

Cuộc chiến pháp lý giữa các nền tảng nội dung và doanh nghiệp AI tiếp tục leo thang. Mới đây, Reddit đã chính thức đưa Perplexity ra tòa, cáo buộc startup này ăn cắp dữ liệu để huấn luyện công cụ trí tuệ nhân tạo của mình...

Perplexity đã bị Reddit kiện vì thu thập trái phép dữ liệu để huấn luyện AI
Perplexity đã bị Reddit kiện vì thu thập trái phép dữ liệu để huấn luyện AI

Nền tảng mạng xã hội Reddit đã đệ đơn kiện công ty khởi nghiệp trí tuệ nhân tạo Perplexity tại tòa án liên bang New York với cáo buộc công ty này cùng ba doanh nghiệp khác thu thập trái phép dữ liệu của Reddit để huấn luyện công cụ tìm kiếm dựa trên AI của Perplexity.

Trong đơn kiện, Reddit cho biết các công ty thu thập dữ liệu đã vượt qua các biện pháp bảo vệ nhằm chiếm đoạt thông tin mà Perplexity được cho là rất cần để vận hành hệ thống answer engine (công cụ trả lời) của mình.

Vụ việc này được xem là một trong nhiều vụ kiện mà các chủ sở hữu nội dung đang tiến hành nhằm chống lại những công ty công nghệ bị cáo buộc sử dụng trái phép tài liệu có bản quyền để huấn luyện trí tuệ nhân tạo. Trước đó, vào tháng 6, Reddit cũng đã khởi kiện công ty AI Anthropic và vụ kiện đó vẫn đang được tiếp tục.

Trong một tuyên bố, Perplexity cho rằng họ luôn duy trì cách tiếp cận có nguyên tắc và có trách nhiệm khi cung cấp các câu trả lời dựa trên dữ kiện thông qua AI chính xác, đồng thời không chấp nhận bất kỳ mối đe dọa nào đối với sự cởi mở và lợi ích công cộng.

Ben Lee, Giám đốc pháp lý của Reddit, nhận định các công ty AI đang lao vào một cuộc chạy đua để giành lấy nội dung do con người tạo ra, chính áp lực đó đã thúc đẩy sự hình thành của một nền kinh tế “rửa dữ liệu” ở quy mô công nghiệp.

Reddit, nền tảng quy tụ hàng nghìn cộng đồng “subreddit” theo từng sở thích, khẳng định mình là một trong những nguồn được trích dẫn nhiều nhất trong các câu trả lời do AI tạo ra. Công ty cũng cho biết đã cấp phép nội dung cho Google, OpenAI và một số tổ chức khác để phục vụ quá trình huấn luyện mô hình AI.

Theo đơn kiện, Oxylabs (Lithuania), AWMProxy (Nga) và SerpApi (Texas, Mỹ) bị cáo buộc thu thập dữ liệu từ hàng tỷ kết quả tìm kiếm trên Reddit mà không được phép. Trong khi Perplexity, công ty không có giấy phép sử dụng nội dung Reddit, đã hợp tác với ít nhất một trong số các bên này để lấy dữ liệu.

Phát ngôn viên của SerpApi cho biết, công ty không đồng tình với các cáo buộc của Reddit và sẽ kiên quyết tự bảo vệ mình trước tòa. Trong khi đó, Oxylabs cho rằng họ bị sốc và thất vọng vì Reddit chưa từng liên hệ trực tiếp trước khi khởi kiện, cùng với đó là khẳng định sẽ bảo vệ quyền lợi của mình trước các cáo buộc. AWMProxy hiện chưa đưa ra bình luận.

Được biết, Reddit đã gửi thư yêu cầu Perplexity ngừng hành vi vi phạm từ năm ngoái, nhưng sau đó công ty này lại tăng số lượng trích dẫn nội dung từ Reddit lên gấp 40 lần.

Trong đơn kiện, Reddit yêu cầu tòa án buộc Perplexity bồi thường thiệt hại (mức cụ thể chưa được xác định) và ra lệnh cấm công ty tiếp tục sử dụng dữ liệu từ nền tảng của mình.

Xem thêm

AI có thật sự làm hóa đơn tiền điện tăng cao?

AI có thật sự làm hóa đơn tiền điện tăng cao?

Dù không phải ai cũng nhìn thấy ngay nhưng cuộc đua AI đang âm thầm đặt một gánh nặng ngày càng lớn lên hệ thống điện toàn cầu. Từ trung tâm dữ liệu đến hóa đơn tiền điện của mỗi hộ gia đình, hệ quả của làn sóng này đang dần hiện rõ…

Có thể bạn quan tâm

Chiến lược đổi mới sáng tạo thúc đẩy doanh nghiệp phát triển

Chiến lược đổi mới sáng tạo thúc đẩy doanh nghiệp phát triển

Trong bối cảnh đất nước đang đẩy mạnh công nghiệp hóa, hiện đại hóa và chuyển đổi số, Liên hiệp Hội Việt Nam cần tiếp tục đóng vai trò cầu nối giữa Nhà nước – doanh nghiệp – các tổ chức khoa học và công nghệ, hỗ trợ xây dựng chiến lược đổi mới sáng tạo cho doanh nghiệp…

Chiếc điện thoại Robot Phone có camera độc đáo của Honor

Honor hé lộ điện thoại có “cánh tay” camera robot độc đáo

Honor vừa hé lộ một khái niệm smartphone đầy táo bạo mang tên “Robot Phone”, sở hữu camera gắn trên cánh tay robot. Đây không chỉ là bước tiến về phần cứng, mà còn là tuyên ngôn cho tham vọng dài hạn của Honor trong việc xây dựng hệ sinh thái thiết bị thông minh mang tính cá nhân, cảm xúc…

Tham vọng làm chủ tế bào ảo khuấy đảo giới công nghệ AI

Tham vọng làm chủ tế bào ảo khuấy đảo giới công nghệ AI

Nhờ sự bùng nổ dữ liệu sinh học và khả năng học máy của AI, giấc mơ mô phỏng toàn bộ hoạt động của một tế bào người đang dần trở thành hiện thực. Các trung tâm nghiên cứu hàng đầu đang chạy đua để xây dựng tế bào ảo, bước tiến có thể định hình lại cả ngành y học và sinh học trong tương lai…

Windows 10 “nghỉ hưu” sau 10 năm phục vụ, người dùng đứng trước ngã rẽ

Windows 10 “nghỉ hưu” sau 10 năm phục vụ, người dùng đứng trước ngã rẽ

Sau hơn 10 năm phục vụ, Windows 10 chính thức dừng hỗ trợ, buộc người dùng phải lựa chọn giữa việc nâng cấp lên Windows 11 để tận hưởng các tính năng mới hoặc đăng ký chương trình để tiếp tục nhận bản cập nhật bảo mật. Đây là bước ngoặt quan trọng giúp bảo vệ thiết bị và duy trì hiệu suất... 

Cơ hội ngàn vàng để Apple làm lại cuộc chơi AI

Cơ hội ngàn vàng để Apple làm lại cuộc chơi AI

Cuộc đua AI không chỉ xoay quanh độ thông minh của mô hình mà còn là cách tích hợp vào đời sống. Trong khi ChatGPT xây dựng một “siêu ứng dụng hội thoại”, Apple âm thầm biến Siri thành chìa khóa mở cánh cửa tương lai di động không cần biểu tượng ứng dụng...

Diễn đàn Trí tuệ nhân tạo Việt Nam – AI360 2025

Vốn đầu tư vào AI tại Việt Nam tăng gấp 8 lần chỉ sau một năm

Trong chưa đầy một năm, Việt Nam đã chứng kiến bước nhảy vọt của ngành AI với mức đầu tư tăng gấp 8 lần. Không chỉ là con số ấn tượng, điều này cho thấy niềm tin ngày càng lớn vào tiềm năng của trí tuệ nhân tạo trong việc thúc đẩy phát triển kinh tế số và nâng tầm vị thế công nghệ quốc gia...

OpenAI đang trở thành “Google của kỷ nguyên AI”?

OpenAI đang trở thành “Google của kỷ nguyên AI”?

Nếu Google từng mở ra kỷ nguyên tra cứu thông tin thì OpenAI đang mở ra kỷ nguyên làm mọi thứ từ viết code đến đặt hàng, học tập, du lịch ngay trong một khung hội thoại. Đó mới chỉ là điểm khởi đầu...