博文

目前显示的是 七月, 2025的博文

AI训练版权重大判决:合法扫描可接受,盗版下载仍侵权

  通用人工智能的训练素材是不是需要取得版权许可的问题一直是版权人和人工智能公司博弈的焦点,近日美国加州北区法院连出两个简易判决,对通用人工智能训练做出认定,构成合理使用。虽然两案都是个案,但这是中美两个人工智能科技领先的国家的法院第一次对此问题给出了答案,今天笔者就和大家聊聊这两个案子涉及的法律问题。   一、案情简介 1 、作家诉 Anthropic 案。 三位作家起诉 Anthropic 公司,指控其使用盗版材料训练其 Claude 模型系列。原告指称 Anthropic 从盗版网站免费下载了数百万本受版权保护的书籍,并将其数字化以构建一个中央图书馆,然后使用这些书籍训练其大语言模型,特别是 Claude 。 Anthropic 后来购买了原告的书籍纸质书籍,然后撕掉装订、剪裁页面,然后将其扫描保存至中央电子图书馆,但仍然保留了从盗版网站获取的书籍副本。   法院经审理后认定:将合法购买的纸质书籍数字化属于合理使用,并且使用这些数字副本来训练大语言模型也具有足够的变革性,因此也属于合理使用。但非法下载的图书副本的使用未被认定为合理使用。后续法院将对 Anthropic 公司非法下载的盗版内容及其造成的损害进行审判。   2 、作家诉 Meta 案 。原告是 13 位作家,发现他们的作品被 Facebook 和 Instagram 的母公司 Meta 用于训练人工智能,遂起诉。审理查明, Meta 需要图书训练人工智能,曾先和出版社协商,发现除了要支付上亿美元授权费用,谈判也会很复杂,因为图书版权多数在作者手里,遂转向盗版获取,其利用 bt 种子下载了大量盗版图书,而 bt 是 P2P 技术,在下载的同时也会上传盗版文件。   法院判决 Meta 的行为构成合理使用,驳回了原告的版权侵权指控。判决认定, Meta 的使用具有高度的转换性,因为其目的是开发能够生成多样化文本的工具,而不是简单地复制或替代原告的书籍。 虽然 原告的书籍是高度表达性的作品,受到较强的版权保护, 且 Meta 复制了原告的书籍的全部内容,但由于 Meta 的 Llama 模型不会输出任何有意义的部分原告的书籍内容,这种使用是合理的。 同时, 尽管原告的书籍市场可能受到间接竞争的影响,但原告未能提供足...