英伟达“付费买盗版”训练AI,中国法律怎么看?
近日,美国版权人起诉英伟达公司使用盗版素材进行 AI 训练的案件备受关注。根据诉状披露,为了尽快获得高达 500 多 TB 的文件,英伟达主动联系了盗版网站安娜的档案( Anna's Archive ),支付了数十万美元费用下载了大量包括书籍、文章等受著作权保护作品的盗版内容。 安娜的档案是一家“影子图书馆”类网站,此类网站以去中心化及匿名化著称,大多都以侵犯著作权的方式向人们提供文献内容。如果原告的指控属实,英伟达这个全球市值最高的公司居然付费从盗版网站下载内容,然后被版权人起诉,不得不说是一个很大的污点。但使用盗版训练素材是几乎所有通用人工智能公司的原罪,在中美这两个人工智能技术领先的国家,有很多相关的诉讼,今天我们来讨论一下,根据中国法律,英伟达被指控的行为是不是违法? 一、 P2P 下载和直接下载法律风险都很高 1 、 安娜的档案的技术特征 要准确分析英伟达的下载行为是否构成侵权,首先必须明确其获取盗版素材的具体方式。根据现有信息,安娜的档案并非传统意义上的盗版下载站,该网站并不直接托管内容,而是链接或索引来自多个盗版来源的资源,很多资源采用去中心化的 P2P (如 BT 种子)技术,数据分布式存储于全球节点。用户下载时,自身也可能成为上传节点。 2 、 P2P 下载的法律风险 如果英伟达使用的是 BT 种子或者磁力链接这样的 P2P 下载模式,这一步就已经涉嫌侵权。因为在 P2P 下载过程中,下载者同时也会成为上传者,将已获取的数据片段上传给其他下载节点。根据中国《著作权法》,上传行为构成了对作品的分发和信息网络传播,涉嫌侵犯版权人的信息网络传播权。不过关于 P2P 下载时的上传行为是不是构成侵权,据笔者的了解,国内法院目前尚无判例,这可能和版权人在国内的诉讼以打击商业主体盗版为主,对个人下载侵权行为没有积极维权有关。 3 、直接下载的侵权认定 即使英伟达是直接从安娜的档案的网站服务器下载数据,情况也并不乐观。因为安娜的档案的数据基本都是盗版图书文献,英伟达在明知的情况下,仍以商业目的获取并使用这些作品,该行为可能面临重大法律风险。英伟达向安娜的档案支付费用获取高速访问权限类似于购买盗版拷贝,中国司法实践中,商业经营中使用盗版文件,不论企业买的是 Wind...