Mục lục bài viết
Bản quyền AI đang trở thành tâm điểm của hơn 50 vụ kiện tập thể tại Hoa Kỳ, nhắm vào các “ông lớn” công nghệ như Meta, Anthropic và OpenAI. Thay vì tranh luận về cách AI sáng tạo nội dung, các tranh chấp hiện nay xoay quanh một câu hỏi cốt lõi hơn: các công ty đã lấy dữ liệu từ đâu để huấn luyện mô hình của mình?
Sự thay đổi này được thể hiện rõ nét nhất qua diễn biến mới nhất trong vụ kiện nhắm vào tập đoàn NVIDIA vào đầu tháng 5 năm 2026.

Vụ kiện NVIDIA: Góc nhìn bản quyền AI từ dữ liệu “đầu vào”
Đầu tháng 5/2026, sự chú ý của giới công nghệ đổ dồn về Tòa án Liên bang khu vực Bắc California với vụ kiện tập thể Nazemian v. NVIDIA Corp.¹. Nhóm nguyên đơn, bao gồm nhiều nhà văn nổi tiếng, cáo buộc NVIDIA đã vi phạm bản quyền khi tự ý tải xuống và sử dụng các tác phẩm văn học của họ để huấn luyện mô hình ngôn ngữ lớn mang tên NeMo Megatron.²
Điểm đáng chú ý nhất của vụ kiện này là cách các tác giả định nghĩa về sự vi phạm. Họ không quan tâm việc văn bản do AI tạo ra có giống với sách của họ hay không (yếu tố “đầu ra”). Thay vào đó, họ nhấn mạnh hành vi vi phạm đã hoàn thành trọn vẹn ngay từ lúc NVIDIA thực hiện thao tác tải và lưu trữ hàng loạt dữ liệu bản quyền để nạp vào hệ thống máy học (yếu tố “đầu vào”).
Các cáo buộc chỉ ra rằng NVIDIA đã cố ý sử dụng dữ liệu từ các “shadow libraries” (tạm dịch “thư viện bóng tối”) – những nguồn chia sẻ tài liệu khổng lồ trên mạng như Books3 hay Anna’s Archive. Thậm chí, tài liệu nội bộ còn cho thấy công ty đã cung cấp các kịch bản lập trình giúp khách hàng dễ dàng tự tải các bộ dữ liệu vi phạm này.

Nguyên tắc “Sử dụng hợp lý” và Điểm mù về “Tổn hại thị trường”
Trong các tranh chấp công nghệ trước đây, các tập đoàn thường dễ dàng chiến thắng khi dùng học thuyết “Sử dụng hợp lý” (Fair Use) làm lá chắn. Lập luận quen thuộc của họ là sự “sử dụng mang tính chuyển đổi” – nghĩa là họ chỉ dùng dữ liệu cũ để nhào nặn ra một công nghệ AI hoàn toàn mới.
Tuy nhiên, điểm neo pháp lý trong các phán quyết hiện nay đang dịch chuyển mạnh mẽ sang một yếu tố khác của học thuyết này: Tổn hại thị trường (Market Harm).³
Vào ngày 04/05/2026, Thẩm phán Jon S. Tigar đã chính thức từ chối yêu cầu hủy bỏ sớm vụ kiện của NVIDIA. Về mặt pháp lý, giới tư pháp đang nhìn nhận rằng bản thân “Dữ liệu đào tạo AI” đã trở thành một loại hàng hóa thương mại độc lập.

Việc các tập đoàn tự ý thu thập hàng triệu tác phẩm miễn phí không còn là sự kế thừa công nghệ thuần túy, mà nó đang trực tiếp tước đoạt và phá hủy thị trường cấp phép dữ liệu hợp pháp đang dần hình thành của các tác giả. Tòa án trong vụ Quizlet (tháng 9/2025) cũng đã chia sẻ chung quan điểm cứng rắn này.⁴
Phán quyết này gửi đi một thông điệp sắc bén: Hành vi thu gom dữ liệu không xin phép đã đủ cơ sở cấu thành thiệt hại kinh tế, buộc các công ty công nghệ phải bước vào quá trình tranh tụng tốn kém và đối mặt với rủi ro phải tiêu hủy toàn bộ các mô hình AI đã trót huấn luyện bằng dữ liệu “bẩn”.
>>> Xem thêm: Luật Bản Quyền KSA 2026: Ngoại Lệ Cho Thuật Toán AI Và Xu Hướng Toàn Cầu
Tác động đến thị trường công nghệ năm 2026
Sự việc của NVIDIA không phải là một hiện tượng đơn lẻ. Bức tranh pháp lý về AI tại Mỹ trong những tháng đầu năm 2026 đang có nhiều chuyển động lớn:
-
Văn phòng Bản quyền Hoa Kỳ liên tục cập nhật các quy định khắc khe về khả năng bảo hộ đối với sản phẩm phái sinh từ AI.⁵
-
Tòa án Tối cao và Quốc hội Mỹ đang xem xét các đạo luật mới nhằm mở rộng ranh giới trách nhiệm bồi thường đối với hành vi xâm phạm bản quyền kỹ thuật số.⁶

Kỷ nguyên thu thập dữ liệu “miễn phí và không giới hạn” trên internet đã khép lại. Các doanh nghiệp phát triển công nghệ sẽ bắt buộc phải coi chi phí mua bản quyền dữ liệu là một khoản đầu tư cốt lõi, thay vì tìm cách lách luật như trước đây.
Nguồn tham khảo:
¹ Nazemian et al. v. NVIDIA Corp., Case No. 4:24-cv-01454-JST (N.D. Cal. 2026), [https://pacer.uscourts.gov/]
² NeMo Megatron là framework mã nguồn mở do NVIDIA cung cấp nhằm xây dựng các mô hình ngôn ngữ tùy chỉnh, [https://developer.nvidia.com/nemo]
³ Mục 107, Đạo luật Bản quyền Hoa Kỳ (17 U.S.C. § 107) quy định về 4 yếu tố của Học thuyết Sử dụng Hợp lý, [https://www.law.cornell.edu/uscode/text/17/107]
⁴ Barkley & Assocs., Inc. v. Quizlet, Inc., Phán quyết của Tòa án cấp hạt tại California (Tháng 9/2025), [https://cases.justia.com/federal/district-courts/]
⁵ U.S. Copyright Office, Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence, [https://www.copyright.gov/ai/]
⁶ Tối cao Pháp viện Hoa Kỳ (SCOTUS), Cox Communications, Inc. v. Sony Music Entertainment, Docket No. 24-171, [https://www.supremecourt.gov/docket/docket.aspx]
|
Khuyến nghị về An toàn pháp lý Tại Monday VietNam, chúng tôi trân trọng sự quan tâm của Quý độc giả đối với các ấn phẩm nghiên cứu chuyên sâu. Nhằm đảm bảo quyền lợi tối ưu và sự an toàn pháp lý cao nhất cho Quý vị, xin vui lòng lưu ý:
|
MONDAY VIETNAM
- E-mail: c@mondayvietnam.com
- Điện thoại: 086 200 6070 – Hotline: 0938 672737
- Trụ sở: 68 Nguyễn Huệ, Phường Bến Nghé, Quận 1, Thành phố Hồ Chí Minh.
- VPGD: Tầng 5, 205A Thuỷ Lợi 4 Tower, Nguyễn Xí, Phường 26, Quận Bình Thạnh, TP. HCM
- Tây Nguyên: 124 Ngô Quyền, Phường Tân Lợi, TP. Buôn Ma Thuột, ĐakLak.
- Hà Nội: Tầng 5, Số 4, Ngõ 81 Hoàng Cầu, Phường Ô Chợ Dừa, Quận Đống Đa.
