博文

为什么国内AI公司签不了“零数据留存协议”?

  2026 年 6 月, Anthropic 公司发布了首款 Mythos 级模型 Claude Fable ,性能惊艳,但近日美国政府下令,出于安全原因,外国人不得使用该模型, Anthropic 被迫停服。实际在该模型发布后不久,微软就已经开始限制员工使用它,原因是 Anthropic 在该模型服务条款中,收紧了数据保留政策,实质上废除了很多企业客户看重的 “ 零数据留存协议 ” 。实际上在中国,国内模型厂商同样不会和客户签这样一份协议。今天,我们就来聊聊这背后的原因。 零数据留存协议简称 ZDR 协议( Zero Data Retention Agreement ),是 AI 服务商给企业客户的一张承诺书:客户的提问和 AI 的回答,不会进行保留,更不会拿去训练模型,在法律、金融、医疗这些对数据合规要求高的行业,以及有能力单独和模型公司签协议的大公司,零数据留存协议几乎是标配。 Anthropic 为什么要主动放弃零数据留存协议,官方解释很直白: Claude Mythos 5 的能力提升太大,安全风险也被放大了,一些滥用行为并不会在单次对话中暴露出来。例如攻击者可能连续发出数百次略有差异的提示词,试图寻找绕过安全限制的方法;某些网络攻击、间谍活动或勒索软件攻击,也往往需要跨多个请求才能识别出异常模式。所以服务商需要在一定时间内保留部分提示词和输出内容,用于安全分析和风险排查。 本案中安全、隐私、技术构成了不可能三角,技术能力、安全治理与隐私保护之间,很难同时达到最优。 Anthropic 在提供更强模型的同时提高了安全治理标准,一定程度放弃了对用户的隐私保护,微软则在更高的技术能力模型和数据隐私保护之间选择了对数据和隐私进行保护。 国内主流 AI 服务商在商业版用户协议中,有不少明确承诺用户数据不用于模型训练,但都没有触及数据不留存。比如阿里云百炼隐私声明规定,阿里云严格保护数据隐私,绝不会将您的数据用于模型训练。字节的火山方舟也明确承诺,未经用户单独同意,不会使用用户数据训练或优化模型。其中的根本原因不在于技术能力或隐私保护意识不足,而是源于中国大陆现行法律框架下, AI 服务商必须履行的法定责任。 根据《网络安全法》第二十三条,网络运营者有留存相关的网络日志不少于六个月的安全保护义务。而《互联网信息服务深度合成管理规定》...

刮码产品商标侵权案件,谁来证明真伪更合理?

  价格便宜,但刮掉了防伪编码的产品在电商平台上很受消费者喜爱。也但因其低价破坏了品牌商的价格体系,店铺经常被起诉商标侵权,多数情况下,如果刮码商品是品牌商生产的正品,我国法院倾向于认定不构成侵权,但实践中还是有很多中小商家哪怕卖正品,还是被判侵权,今天就跟大家聊聊此类案件审理应如何平衡品牌保护与经营自由。 一、防伪码也是品牌商的控价码 现行商标法的原则就是商品一旦售出,权利人的商标权就用尽了,商标权人原则上无权继续控制购买者的二次销售行为,因此买到商品的人可以再次销售。 销售刮码商品也是对商品的二次销售,刮码行为本身并不会改变商品真实性,销售商刮码可能只是为了逃避品牌商的渠道追踪。 因为很多防伪码,既承担防伪功能,也承担了品牌商的渠道监控功能,也就是防止销售商窜货。为什么品牌商害怕窜货?因为品牌商一般会建立自己的经销商体系和价格体系,对各区域的销售价格进行控制,窜货会导致产品被低价跨区域销售,从而打乱品牌商的定价体系,破坏经销商等级,降低高端品牌溢价,导致不同地区价格竞争。本质上:窜货是在打破品牌商人为制造的价格壁垒。 二、美国法院倾向认定正品刮码也构成商标侵权 设置注册商标保护制度,除了鼓励品牌商创设品牌,更重要的是要保护消费者的利益。但消费者利益实际也分两个层次,首先是低价获得正品,包括更低价格、商家之间更充分的竞争、打破区域垄断。 其次,消费者的利益也包括 完整售后与产品的可追溯性,而防伪码的溯源功能与此有关。品牌商分区域销售,并规定刮码产品不享受售后服务,部分目的也是为了保护当地销售商的利益,因为当地销售商会承担当地的售后服务成本,窜货销售者会逃避这部分成本承担,所以设置溯源编码控制渠道对其进行保护也有一定合理性。 实践中我国法院更倾向于保护让消费者低价获得正品的利益,而美国法院则更重视对品牌售后和产品可追溯性的保护。所以哪怕产品是正品,也倾向于判定经销商擦除溯源编码的行为构成商标侵权。 美国有个著名的案例, Zino Davidoff SA v. CVS Corp. 案:原告 Davidoff 是一家高端香水奢侈品品牌,被告 CVS 是一家零售药店连锁店,在销售 Davidoff 的香水产品时移除了产品的溯源编码( UPC ), Davidoff 起诉其构成商标侵权,损害了其品牌声誉和质量控制。被告 CVS 认为移...

RAG技术冲击内容生态,版权人如何向AI搜索维权?

图片
  互联网时代,传统媒体围绕用户访问点击建立了广告和直接收费两种商业模式。但人工智能搜索的出现,特别是使用 RAG ( Retrieval-Augmented Generation ,检索增强生成)技术的公司能让用户多数时候直达答案省去点击。所以传统媒体开始了对 RAG 模式的 AI 服务商的大规模维权,用版权侵权起诉野蛮生长的 AI 公司,用反垄断起诉没那么野蛮的,总之就是告你没商量。 一、 RAG 技术破坏的是传统媒体网站生态 作为版权人的传统媒体认为,和传统大模型训练后输出模式相比, AI 搜索结果页能直接替代对源网站进行访问,没人访问网站就没有广告点击,也没有了付费订阅,内容真正的创作者就没有了收入来源,所以 AI 搜索不是在创新,而是在系统性劫持原创内容,破坏创作生态。 而其中的罪魁祸首,就是 RAG 模式。传统大模型,比如 OpenAI 的早期模式,是通过海量数据训练,让模型消化知识,输出时模型基于概率生成新文本,绝大多数情况下,不会对训练素材,比如某篇特定文章进行完整复制。而在 RAG 模式下, AI 收到用户提问会在后台实时检索互联网,找到相关内容,然后将这些内容增强进输出内容。此时,如果 AI 服务商在输出端不做控制的,生成的内容就有可能会和被检索到的文档非常相似,将构成法律意义上的复制。 但即便 AI 服务商在进行控制,让输出的内容具有更强的转换性,不构成对被检索内容的复制,实际搜索结果页也会对提供原创内容的源网站起到替代作用,用户多数情况下也无需访问源网站,这实际破坏了被抓取内容网站的生态。 二、 CNN 起诉野蛮人 Perplexity Perplexity 是一家印度裔创业者创设的人工智能服务商,可能因为其基础模型能力不够强,所以其 RAG 模式的运营非常激进,完全不尊重法律和行业传统。 2026 年 5 月,美国 CNN 公司向纽约南区联邦法院起诉 Perplexity ,根据诉状,用野蛮生长形容 Perplexity 毫不为过。 Perplexity 首先通过自家爬虫大规模抓取 CNN 的新闻、图片、视频,建立起一个巨大索引,当用户向 Perplexity 提问时,系统会根据问题检索 CNN 的相关文章全文,然后把文章内容直接装进模型上下文并生成答案。这些答案在很大程度上就是对 CNN 原文的大段...