Thời báo New York (New York Times) đã đệ đơn kiện Microsoft và OpenAI với cáo buộc vi phạm bản quyền và lạm dụng quyền sở hữu trí tuệ của tờ báo để đào tạo các mô hình ngôn ngữ lớn.
Trong một hồ sơ gửi lên Tòa án quận phía Nam New York (Mỹ), tờ New York Times cho biết họ muốn Microsoft và OpenAI phải chịu trách nhiệm về hàng tỷ USD thiệt hại theo luật định và thực tế mà tờ báo phải chịu khi hai công ty này sao chép và sử dụng bất hợp pháp các tác phẩm có giá trị độc đáo của New York Times.
Nhấn mạnh trong một phát biểu gửi qua email tới CNBC, New York Times thừa nhận sức mạnh và tiềm năng của AI tạo sinh đối với công chúng và báo chí, nhưng tất cả những tài liệu báo chí phải được sử dụng để đào tạo các mô hình này phải có lợi ích thương mại và có sự cho phép của nguồn chính.
Tờ New York Times khẳng định, những công cụ AI được xây dựng một phần dựa trên những thông tin, tài liệu mà các phóng viên, nhà báo mất công sức tìm hiểu, nghiên cứu, báo cáo, chỉnh sửa và xác minh tính xác thực, kèm theo đó cũng là chi phí cao và kiến thức chuyên môn đáng kể.
Đại diện của New York Times bổ sung thêm: “Luật bản quyền sẽ bảo vệ hoạt động báo chí và nội dung báo chí. Nếu Microsoft và OpenAI muốn sử dụng sản phẩm báo chí cho mục đích thương mại, luật pháp yêu cầu họ trước tiên phải xin phép các đơn vị. Nhưng họ đã không làm như vậy”.
Trả lời lại câu hỏi về sự việc, OpenAI cho biết: “Chúng tôi tôn trọng quyền của người sáng tạo cũng như chủ sở hữu nội dung và cam kết hợp tác với họ để đảm bảo họ được hưởng lợi từ công nghệ AI và các mô hình doanh thu mới. Các cuộc thảo luận với tờ New York Times trước đây đã diễn ra một cách hiệu quả và tiến triển theo hướng xây dựng, vì vậy chúng tôi rất ngạc nhiên và thất vọng với diễn biến này. Chúng tôi hy vọng có thể sớm tìm ra cách hợp tác cùng có lợi với New York Times, giống như cách chúng tôi đang bắt tay với nhiều nhà xuất bản khác”.
Đại diện của Microsoft đã không trả lời yêu cầu bình luận.
Tờ New York Times được hỗ trợ pháp lý bởi Susman Godfrey, công ty luật đã đại diện cho tác giả Julian Sancton và các nhà văn khác trong một vụ kiện riêng chống lại OpenAI và Microsoft với cáo buộc sử dụng tài liệu có bản quyền chưa được cho phép.
New York Times là một trong nhiều tổ chức truyền thông đang đòi bồi thường từ các công ty đứng sau một số mô hình trí tuệ nhân tạo tiên tiến nhất vì bị cáo buộc sử dụng nội dung của họ để đào tạo các chương trình AI. Các nhà xuất bản truyền thông và người sáng tạo nội dung nhận thấy tài liệu của họ đang được sử dụng và mô phỏng lại bởi các công cụ AI tổng hợp như ChatGPT, Dall-E, Midjourney và Stable Diffusion. Trong nhiều trường hợp, nội dung mà chương trình tạo ra có thể rất giống với tài liệu nguồn.
Các nhà xuất bản lo ngại rằng, với sự ra đời của các chatbot AI tổng hợp, sẽ có ít người nhấp vào các trang tin tức hơn, dẫn đến lưu lượng truy cập và doanh thu bị thu hẹp.
New York Times đã đưa ra nhiều ví dụ liên quan đến các trường hợp trong đó GPT-4 tạo ra các phiên bản sửa đổi của tài liệu do tờ báo xuất bản. Điển hình, hồ sơ cho thấy phần mềm của OpenAI tạo ra văn bản gần như giống hệt với một bài báo của Times về các hoạt động cho vay nặng lãi trong ngành taxi của Thành phố New York. Nhưng trong phiên bản của OpenAI, GPT-4 đã loại bỏ một phần bối cảnh quan trọng về số tiền mà thành phố kiếm được từ việc bán giấy phép taxi (taxi medallions) và thu thuế đối với doanh số bán hàng tư nhân.
Các mô hình AI cũng hạn chế cơ hội thương mại của New York Times khi thay đổi nội dung của bài viết. Ví dụ: nhà xuất bản cáo buộc các kết quả đầu ra của GPT sẽ xóa các liên kết đến các sản phẩm có trong ứng dụng Wirecutter, một nền tảng đánh giá sản phẩm, do đó tước đi cơ hội thu nhận doanh thu từ việc giới thiệu của tờ báo và chiếm lấy cơ hội đó cho bản thân.