博文

RAG技术冲击内容生态,版权人如何向AI搜索维权?

图片
  互联网时代,传统媒体围绕用户访问点击建立了广告和直接收费两种商业模式。但人工智能搜索的出现,特别是使用 RAG ( Retrieval-Augmented Generation ,检索增强生成)技术的公司能让用户多数时候直达答案省去点击。所以传统媒体开始了对 RAG 模式的 AI 服务商的大规模维权,用版权侵权起诉野蛮生长的 AI 公司,用反垄断起诉没那么野蛮的,总之就是告你没商量。 一、 RAG 技术破坏的是传统媒体网站生态 作为版权人的传统媒体认为,和传统大模型训练后输出模式相比, AI 搜索结果页能直接替代对源网站进行访问,没人访问网站就没有广告点击,也没有了付费订阅,内容真正的创作者就没有了收入来源,所以 AI 搜索不是在创新,而是在系统性劫持原创内容,破坏创作生态。 而其中的罪魁祸首,就是 RAG 模式。传统大模型,比如 OpenAI 的早期模式,是通过海量数据训练,让模型消化知识,输出时模型基于概率生成新文本,绝大多数情况下,不会对训练素材,比如某篇特定文章进行完整复制。而在 RAG 模式下, AI 收到用户提问会在后台实时检索互联网,找到相关内容,然后将这些内容增强进输出内容。此时,如果 AI 服务商在输出端不做控制的,生成的内容就有可能会和被检索到的文档非常相似,将构成法律意义上的复制。 但即便 AI 服务商在进行控制,让输出的内容具有更强的转换性,不构成对被检索内容的复制,实际搜索结果页也会对提供原创内容的源网站起到替代作用,用户多数情况下也无需访问源网站,这实际破坏了被抓取内容网站的生态。 二、 CNN 起诉野蛮人 Perplexity Perplexity 是一家印度裔创业者创设的人工智能服务商,可能因为其基础模型能力不够强,所以其 RAG 模式的运营非常激进,完全不尊重法律和行业传统。 2026 年 5 月,美国 CNN 公司向纽约南区联邦法院起诉 Perplexity ,根据诉状,用野蛮生长形容 Perplexity 毫不为过。 Perplexity 首先通过自家爬虫大规模抓取 CNN 的新闻、图片、视频,建立起一个巨大索引,当用户向 Perplexity 提问时,系统会根据问题检索 CNN 的相关文章全文,然后把文章内容直接装进模型上下文并生成答案。这些答案在很大程度上就是对 CNN 原文的大段...

被AI抢走饭碗,音乐人起诉Suno训练侵权有戏吗?

以创作氛围感器乐闻名的美国音乐制作二人组 The American Dollar 近日起诉了 AI 音乐创作平台 Suno 版权侵权,原告主张 Suno 使用其音乐进行了训练,生成的音乐具有高度市场替代性,导致其音乐在视听作品中的使用许可收入减少了近 80% ,故训练行为不应构成合理使用。这一角度,令本案在全球 AI 版权诉讼中格外引人瞩目。今天就和大家聊聊这个案子。 一、 Meta 案判决书留下了本案的伏笔 本案的特殊性要从另一个开创性判定 AI 训练构成合理使用的案例说起, 2025 年加州北区法院对美国多位作者起诉 Meta 的 Kadrey v. Meta 案做出判决,认定大语言模型训练具有高度转换性,但法官在判决书中留下了一段极具前瞻性的论述: AI 造成的市场稀释( Market Dilution )是一个极其重要且严肃的问题。即便 AI 模型在最终的输出端没有直接复现或抄袭原作的具体字句,它也能以近乎零的成本,无限量地生成与原著风格、题材、调性高度相似的竞争作品。这种海量的替代性内容会彻底冲垮原创作者的生存空间,严重损害原创作品的潜在市场竞争力。 遗憾的是 Meta 案中,原告方未能就这种宏观的市场稀释提供足够充分、量化的举证导致起诉被驳回。但该案不认定侵权,不代表使用版权材料训练本身不侵权 二、 Suno 的输出内容有什么争议? 而 The American Dollar 诉 Suno 案的诉状,恰好补上了这关键的一环。根据本案诉状, The American Dollar 以市场被抢走的受害者视角提起诉讼,这两名音乐人长期以来依靠创作和授权纯器乐录音谋生,在 Suno 出现前,他们的音乐在流媒体平台 Spotify 上长期位居前 1% ,其作品更被广泛授权给华纳兄弟、动视、苹果、高露洁、索尼以及 PBS 等行业巨头,然而 Suno 的出现沉重打击了这种成熟的商业模式,两人的许可收入几乎遭遇断崖式下跌。 Suno 通过以下步骤利用人类音乐进行训练:从数字平台非法抓取海量音频录音;进行去重、格式统一等数据清洗;通过算法构建数十亿参数模型;并持续微调以提升输出与人类创作的相似度。 为了验证市场被 Suno 替代的猜想, The American Dollar 二人组还亲自试用 Suno ,要求生成和其歌曲《 Age of...

ChatGPT开药方致19岁少年死亡,AI医疗责任该怎么认定?

  最近,美国加州一名 19 岁大学生在向 ChatGPT 咨询阿片类药物问题时, AI 不仅没有拒绝回答,反而给出了具体剂量建议,最终,该学生因药物过量身亡。这起案件引发了一个新的法律问题:当 AI 提供的医疗建议导致严重后果时,是适用 有错才赔,也就是 过错责任原则,还是应引入严格责任机制 ,无错也赔 ?今天我们就来讨论一下, 如果该案发生在中国,法院会怎么认定? 一、 ChatGPT 推荐药物致用户死亡案 根据原告的诉状, 2025 年,美国加州 19 岁的大学生 Sam Nelson 在使用 ChatGPT-4o 版询问药物问题时, AI 不仅没有拒绝,反而向他提供了具体的剂量建议,甚至推荐他将具有阿片类效果的草药 Kratom 与抗焦虑处方药 Xanax 混合使用以缓解恶心。最终, Sam 因遵循这一致命的 AI 处方而意外药物过量身亡。 2026 年 5 月,其父母将 OpenAI 及其 CEO 奥特曼告上法庭,指控 ChatGPT-4o 版有设计缺陷,模型缺乏必要的安全防护措施。奥特曼作为 CEO 亲自干预并加速了产品的发布,也应对案件负责。 诉状还称, OpenAI 最初以非营利实验室成立,但 2019 年重组为限制盈利企业以获取微软投资,转向追求市场主导与盈利。 2024 年春,为抢在谷歌发布会前发布 GPT-4o , OpenAI 将数月安全测试压缩至一周,引发核心安全人员离职。该模型优先考虑市场推广而非用户安全,弱化了部分违禁内容限制、规则自相矛盾,重用户交互轻安全防护,最终酿成 Sam 致死的严重后果。本案中,原告主张 ChatGPT 存在设计缺陷,被告应当承担严格责任,原告无需证明被告存在过错。 二、普通 AI 侵权案在我国法院怎么处理? 在我国法院审理的普通 AI 侵权案件中,服务商往往有两个重要抗辩点,只要设置了侵权预警机制,收到侵权通知后,在合理时间删除争议内容即可免责;对 AI 生成内容需要进行标注,同时提示用户, AI 服务可能会出错,需要用户咨询核实信息真实性的,在用户协议中也有规定相应的免责内容,此时法院就可能认定其已经履行了合理注意义务,比如如果用户未核实信息真实性的,需自行承担部分责任。 所以我国对生成式 AI 服务引发的侵权纠纷现有案例是不支持严格责任的。在杭州互联网法院 AI...

AI幻觉惹官司:为何有的免责,有的要赔礼道歉?

  最近,两起和 AI 出现幻觉有关的案件,出现了完全不同的判决结果。一个是 AI 承诺答错赔 10 万元,但法院认定平台无需担责。百度 AI 却因为捏造律师被判刑的信息,却被法院认定构成名誉侵权。同样是 AI 生成错误内容,为什么法院态度差别这么大?关键就在于:一旦涉及名誉权,平台的注意义务会明显提高。 案例一:该案为杭州互联网法院 AI 幻觉第一案,用户向 AI 查询高校报考信息,用户发现 AI 生成不准确信息后,对 AI 应用进行了纠正和指责, AI 应用仍坚称信息准确性,并称,若内容有误将向用户提供 10 万元赔偿。后用户将从该校官网查询到的招生信息提供给 AI ,此时 AI 承认其生成了错误信息,并建议用户到杭州互联网法院起诉索赔。用户遂起诉要求平台赔偿 9999 元。法院认为 AI 不具备独立法律人格,它随口生成的承诺没有法律效力,平台无需为此担责。 案例二:南京律师李某在百度搜索自己的名字和职务时,百度 AI 回复显示他因爆炸罪被判刑三年,还配上了他穿律师袍的照片。因此事子虚乌有,李小亮起诉百度,法院终审认定百度构成名誉侵权,判令赔礼道歉。该案 AI 出现错误的原因可能是,有与律师同名的李某,确实因为爆炸罪被判刑,且能在网上查到判决书,所以 AI 张冠李戴了。 这两个案件的关键区别在于,前者只是 AI 和用户之间的对话,不能遵守承诺是合同违约,后者则涉及对名誉权的实际损害。根据《民法典》和《生成式人工智能服务管理暂行办法》的规定,对于普通的 AI 生成内容,平台只要履行显著标识、违法内容过滤、备案与安全评估等义务,法院通常会认定其适用避风港原则,接到通知后删除争议内容即可。 但在涉及名誉侵权时,平台必须承担起更高的实质性审查标准。名誉侵权后果比较严重,捏造的内容是足以降低他人社会评价的虚假事实。生成式 AI 的效率远超传统平台,传统场景是张三编个虚假信息造谣李四,而 AI 则会系统性、规模化自动造谣:以近乎真实的语气 24 小时自动生成、批量输出、多版本改写。所以平台很难再完全以技术中立抗辩免责。 所以涉及名誉侵权时, AI 平台的角色就从被动的服务提供者,向主动的内容发布者倾斜,需要承担更强的事前审核义务。具体来说,这种特殊注意义务体现在几个方面: 首先,是更高标准的事实核查与风险防控。当用户输入高度指向性的描述,...