Trong cuộc đua giành quyền kiểm soát nguồn tài nguyên giá trị nhất kỷ nguyên AI - dữ liệu, Reddit vừa tung ra một đòn tấn công pháp lý mạnh mẽ nhắm vào Anthropic. Vụ kiện này không chỉ là một tranh chấp kinh doanh thông thường, mà là một phép thử quan trọng về quyền sở hữu không gian số và giới hạn của các mô hình trí tuệ nhân tạo.
Reddit cáo buộc Anthropic đã hành động với "ác ý" khi liên tục phớt lờ file robots.txt - tiêu chuẩn kỹ thuật ngăn chặn việc thu thập dữ liệu tự động. Nghiêm trọng hơn, hồ sơ kiện chỉ ra rằng Anthropic đã sử dụng các mạng lưới proxy tinh vi được gọi là Hydra Clusters. Đây là hệ thống bao gồm hơn 24.000 tài khoản giả mạo, giả dạng người dùng bình thường để lách qua các rào cản kỹ thuật của Reddit và thu thập hàng tỷ bài đăng trái phép.
"Việc huấn luyện AI trên những gì con người đã chọn xóa bỏ không chỉ là vi phạm bản quyền, đó là sự xâm phạm thô bạo vào quyền riêng tư số." - Trích hồ sơ kiện của Reddit.
Điểm gây sốc nhất là Anthropic bị cáo buộc đã thu thập cả những nội dung mà người dùng đã xóa từ lâu. Reddit khẳng định điều này vi phạm nghiêm trọng quyền "được lãng quên" của con người. Nếu Reddit thắng kiện, đây sẽ là dấu chấm hết cho kỷ nguyên thu thập dữ liệu miễn phí và buộc các tập đoàn AI phải chi trả sòng phẳng cho nguồn nguyên liệu cấu thành nên trí tuệ của mình.


