CEO Twitter Elon Musk đã cáo buộc Microsoft sử dụng trái phép dữ liệu của công ty truyền thông xã hội để đào tạo mô hình trí tuệ nhân tạo của mình.
“Họ đã đào tạo AI trái phép bằng cách sử dụng dữ liệu Twitter,” Elon Musk viết trên Twitter. “Thời điểm cho một vụ kiện đã tới”.
Elon Musk vốn là người đồng sáng lập OpenAI trước khi rời hội đồng quản trị vào năm 2018 và gần đây đã phàn nàn về việc công ty chuyển từ mô hình phi lợi nhuận sang một doanh nghiệp có giá trị cao từ các ảnh hưởng của Microsoft. Năm ngoái, Microsoft đã đầu tư 10 tỷ USD vào OpenAI trong một thỏa thuận có cấu trúc khác thường.
Bản thân ông Elon Musk cũng từng tiết lộ vào tháng 12 rằng Twitter sẽ tạm dừng quyền truy cập của OpenAI vào cơ sở dữ liệu của họ, đồng thời công bố kế hoạch xây dựng mô hình ngôn ngữ riêng với tên gọi là TruthGPT tại một trong những công ty thuộc sở hữu cá nhân.
Tỷ phú Elon Musk, đồng thời là CEO của Tesla và SpaceX, là người có xu hướng thích đưa ra những “lời doạ” trên mạnh xã hội nhưng dường như không có vụ kiện nào được đệ trình.
Tuy nhiên, sự bất bình của ông Elon Musk lại là dấu hiệu mới nhất cho thấy quyền sở hữu dữ liệu đang nhanh chóng trở thành một chiến trường khốc liệt trong cơn sốt AI. Các công ty công nghệ lớn đang nỗ lực phát triển các mô hình trí tuệ nhân tạo tiên tiến trong khi chủ sở hữu dữ liệu đang tìm cách ngăn chặn hoặc tính phí sử dụng nội dung và dữ liệu trong AI.
Trong thời gian qua, Microsoft đã phát triển mô hình ngôn ngữ lớn (LLM) của riêng mình và bán quyền truy cập cho các mô hình của OpenAI.
Các LLM, như ChatGPT, yêu cầu hàng terabyte dữ liệu để đào tạo, phần lớn trong số đó được lấy từ các trang web như Reddit, StackOverflow và Twitter. Dữ liệu đào tạo từ các mạng xã hội rất có giá trị vì nó ghi lại các cuộc trò chuyện thân thiết và đời thực nhất của người dùng Internet.
Khi các mô hình AI mới này chuyển từ chế độ nghiên cứu sang thế giới doanh nghiệp thực tế, các đơn vị chủ sở hữu dữ liệu bắt đầu “vào cuộc”. Điển hình gần đây, Reddit cho biết họ sẽ tính phí các công ty truy cập vào giao diện lập trình được sử dụng để đưa các cuộc hội thoại giữa các Redditor (người dùng Reddit) vào phần mềm đào tạo AI.
Universal Music Group cũng đã có phản ứng tức giận với một video bài hát sử dụng AI để bắt chước rapper người Canada Drake, cho biết trong tuần này này rằng đây là hình thức vi phạm luật bản quyền cơ bản.
Bên cạnh đó, cơ sở dữ liệu ảnh Getty Images nổi tiếng cũng đang đâm đơn kiện Stable Diffusion, cáo buộc rằng công ty đã sao chép nội dung của họ để đào tạo trình tạo hệ thống AI hình ảnh của mình.
Ở một góc nhìn khác, nhiều ý kiến cho rằng lời đe dọa kiện tụng của Elon Musk đưa ra vào thời điểm này là bởi có một số báo cáo chỉ ra rằng Microsoft sẽ loại bỏ Twitter khỏi nền tảng quảng cáo của họ. Điều này sẽ cho phép người mua quảng cáo quản lý tất cả các tài khoản mạng xã hội của họ ở một nơi.