Runway, một công ty khởi nghiệp AI được đầu tư bởi Google và Nvidia, đã gây ấn tượng với công cụ tạo video AI chân thực và độc đáo. Công cụ mới nhất của Runway, Gen-3 Alpha, ra mắt vào tháng 6, được quảng cáo là có khả năng “tạo video theo bất kỳ phong cách nào bạn có thể tưởng tượng”. Tuy nhiên, theo một báo cáo từ 404 Media, để có được khả năng ấn tượng đó, Runway đã sử dụng hàng nghìn video YouTube và phim lậu để huấn luyện mô hình AI của mình.
404 Media đã thu thập được một bảng tính chứa dữ liệu huấn luyện của Runway, trong đó liệt kê các liên kết đến nhiều kênh YouTube thuộc sở hữu của các công ty giải trí lớn, bao gồm Netflix, Disney, Nintendo và Rockstar Games. Bên cạnh đó, danh sách này còn có cả các kênh của những nhà sáng tạo nội dung nổi tiếng như MKBHD, LinusTechTips và Sam Kolder. Đáng chú ý, một số kênh tin tức như The Verge, The New Yorker, Reuters và Wired cũng góp mặt trong danh sách này..
Một cựu nhân viên của Runway tiết lộ với 404 Media rằng: “Việc thu thập các kênh trong bảng tính đó là nỗ lực trên toàn công ty nhằm tìm kiếm những video chất lượng tốt để xây dựng mô hình. Sau đó, những video này được sử dụng làm dữ liệu đầu vào cho một trình thu thập web khổng lồ, công cụ này sẽ tải xuống tất cả video từ các kênh đó, sử dụng proxy để tránh bị Google chặn.”
Không chỉ dừng lại ở YouTube, 404 Media còn phát hiện ra rằng bộ dữ liệu của Runway chứa các liên kết đến các trang web vi phạm bản quyền như KissCartoons, nơi cho phép người dùng xem anime và nội dung hoạt hình miễn phí. Mặc dù Runway khẳng định sử dụng “bộ dữ liệu nội bộ, được tuyển chọn” để huấn luyện mô hình, nhưng công ty vẫn chưa đưa ra bằng chứng xác thực thông tin này.
Trước những cáo buộc trên, Google đã nhắc lại tuyên bố của CEO YouTube – Neal Mohan, người từng khẳng định việc huấn luyện AI bằng video trên nền tảng này là “hành vi vi phạm rõ ràng” các chính sách của YouTube.
Vụ việc của Runway không phải là trường hợp duy nhất liên quan đến việc sử dụng dữ liệu YouTube để huấn luyện AI. Trước đó, đã có thông tin cho rằng Anthropic, Apple, Nvidia và Salesforce cũng đã sử dụng hơn 170.000 video YouTube để huấn luyện mô hình AI của mình.
Sự việc này một lần nữa gióng lên hồi chuông cảnh báo về vấn đề bản quyền và đạo đức trong lĩnh vực trí tuệ nhân tạo. Việc sử dụng dữ liệu có sẵn trên mạng mà chưa được sự cho phép của chủ sở hữu có thể gây ra nhiều tranh cãi pháp lý và ảnh hưởng đến uy tín của các công ty công nghệ.
Nguồn tin: https://genk.vn/cho-phep-tao-video-tu-van-ban-startup-ai-bi-to-an-cap-youtube-de-sang-tao-20240726185943246.chn