正版调门拉得太高,Adobe用AI图片训练AI被自家股东告了

 

近日,一贯高调版权维权的美国软件公司Adobe及其管理层因为用盗版素材训练AI被自家股东在加州北区法院起诉虚假陈述。诉状描述的核心盗版问题包括Adobe使用大量盗版书籍,以及源自竞争对手MidjourneyAI图片训练其AI模型,用盗版训练AI的法律问题笔者经常聊,今天就跟大家聊聊,用AI生成的图片训练AI模型有什么法律风险。

先介绍下案情,Adobe被起诉的案件其实是个涉及证券法的虚假陈述诉讼,Adobe因使用包含盗版书籍的SlimPajamaBooks3等数据集训练Slim LM模型被起诉版权侵权。另外,彭博社报道称,Adobe的图像生成AI萤火虫(Firefly)训练数据中包含部分Midjourney等平台的AI生成图片,而Midjourney AI模型有大量训练素材是未经授权的图片。但Adobe在给美国证监会的文件和公开宣传中反复强调仅使用授权内容训练 AI”。两件事情都涉嫌虚假陈述,误导投资者。

使用Midjourney AI生成的图片是不是涉嫌侵权,首先看AI生成的图片本身是否受著作权保护。著作权法的基本原理就是人创作的内容才受著作权保护,纯粹由AI自动生成的内容,因为缺乏人类创造性投入,很难构成著作权法意义上的作品。如果作品本身没有版权,那么后续训练行为自然难以构成对该图片版权的侵害。

不过国内法院的判决给了此问题一定争议,2023年北京互联网法院在春风送来了温柔案中认定,原告通过精心设计提示词、调整参数、选定图片,体现了个人创造性,该AI生成图片构成美术作品,享有著作权。如果此观点成立,那么使用AI图片训练AI,也可能会有涉嫌侵权提示词作者美术作品版权的争议。

不过2024年风向就转变了,江苏张家港法院在幻之翼透明艺术椅案中则持相反观点,其判决认定原告仅输入简单提示词,缺乏实质智力投入记录,图片不构成作品。2025年,上海黄浦区法院审理的AI生成图片涉及的提示词侵权案中,认为即便是较长的提示词,仍属抽象构思,不构成文字作品,更不用说图片本身了,也驳回了原告诉请。总体而言,笔者认为北京互联网法院的案例是个良好的探索,但目前的主流趋势还是倾向于认定AI生成的图片不构成受著作权法保护的作品。

实际上,用AI生成图片作为素材训练AI的主要风险来自于素材中的特征性表达元素。Midjourney AI模型是利用海量互联网图片训练出来的,其中不少素材并未取得原作者授权。如果训练数据中的特征性表达被AI保留,并在后续生成过程中被输出到新图片之中,那么这些图片仍然可能与原作品产生版权冲突。

当然,从合规角度看,Adobe的做法比包括Midjourney在内的许多同行更谨慎。Adobe并没有直接从Midjourney网站大规模抓取图片建立训练库,而是允许用户将图片上传至Adobe Stock。之后Adobe再根据规则决定是否将相关内容纳入训练体系。对于被采用的素材,上传者还有机会获得相应奖励。

这种模式至少避免了两类常见风险。其一是违反网站用户协议。即使AI图片最终不受著作权法保护,大规模抓取平台内容仍可能违反网站服务条款。其二是不正当竞争风险。如果企业批量抓取竞争对手平台积累的大量内容,用于训练自己的商业模型,即便单张图片没有版权,也可能被认定为攫取他人成果、破坏市场竞争秩序。

AI训练素材量很大,诉状引用的媒体报道称:“Adobe表示,来自Midjourney的图像仅占训练材料的5%。这不是一个很好的辩护。该公司拥有2.48亿张授权图像,所以那可能是多达125万张图片。”(此处原文数据有误,2.48亿的5%应为1240万张图片)。表面看来,基数如此之大,其中的版权风险确实不小,但Adobe如果根据规则对加入训练体系的图片进行过审核,虽然不能百分之百的屏蔽风险,至少图片直接侵权的法律风险是不大的。

Adobe的真正问题是隐藏事实,其一边高调宣传萤火虫AI不同于Midjourney,生成内容默认可商用,仅使用授权内容训练,并承诺承担版权纠纷责任的AI;一边悄悄将存在版权争议的MidjourneyAI图片纳入训练数据,对外宣称的训练数据来源,与实际使用的训练数据之间存在极大的反差,这才是股东诉讼的核心问题。

股东诉状在结尾处有一段话,颇具警示意味,值得引用:"对于像Adobe这样的软件公司而言,包括版权保护在内的知识产权,是公司的核心命脉。如果第三方可以任意侵犯Adobe的版权,Adobe的软件将毫无价值,公司的收入将会崩溃。同理,如果Adobe侵犯了他人的版权,便将自身暴露于巨额赔偿的风险之中。更糟糕的是,如果Adobe自己的软件开发方式违反了知识产权法规……后果将是灾难性的。这些违法行为将威胁到公司从软件中获得的大量重复性收入,因此不仅会使公司面临损害赔偿责任,还会对其收入、利润和增长率产生不利影响。"

说起来,这段话本来是Adobe用来向投资者讲述自身价值主张的,如今却被股东用来起诉它自己。

本文作者:游云庭,知识产权律师。Email: yytbest@gmail.com,本文仅代表作者观点。

 

 

 

评论

此博客中的热门博文

苹果iCloud云存储被诉垄断宰客,我国消费者可以起诉吗?

《阴阳师》能打赢《王者荣耀》的抄袭官司吗?

暴雪为什么再次申请《魔兽世界》商标?