DeepSeek再被针对,美巨头怒告三家中国AI公司,模型蒸馏到底算不算“偷”?_Claude_企业_MiniMax_MK(体育科技有限公司)体育·官方网站
出品|搜狐科技
作者|郑松毅
编辑|杨锦
数小时前,美国AI巨头Anthropic在***及社交平台X同步抛出一份重磅指控报告,将矛头直指中国三家知名AI企业——深度求索(DeepSeek)、月之暗面(Moonshot AI)与稀宇科技(MiniMax),控诉三者实施了“工业化规模”的模型蒸馏攻击,通过数万虚***账号窃取Claude模型的核心能力,一时间受到全球AI行业的关注。
搞“双标”指责中国企业,遭马斯克嘲讽
Anthropic在控诉中措辞严厉,将此次攻击定义为“有记录以来规模最大的案例之一”。公司“高度确信”三家中国企业通过搭建复杂的虚***账号网络,绕过Anthropic针对中国地区的访问限制与安全验证,对Claude模型发起了大规模交互攻击,核心目的就是提取模型能力用于训练自家竞品。
据披露细节:为实施攻击,三家企业共创建约2.4万个虚***账号,通过转售API访问权限的代理服务接入Claude,累计发起超过1600万次交互。更隐蔽的是,攻击者***用了名为“九头蛇集群”的分布式架构,将恶意蒸馏流量与正常用户请求混合,以此规避检测。
搜狐科技从Anthropic控诉的内容中发现,三家被指控的中国企业攻击策略各有侧重。
其中,DeepSeek以约15万次交互聚焦“思维链”提取,通过精心设计的提示词,诱使Claude一步步阐述内部推理过程,直接获取可用于模型训练的核心数据。
月之暗面则以340万次交互主攻智能体电脑操作、复杂推理及代码编写能力。
MiniMax以1300万次交互成为规模最大的攻击者,重点提取智能体编码与工具编排能力,甚至在Anthropic推出新版Claude后,24小时内便将近一半抓取通道转向新系统,其反应速度令Anthropic尤为警惕。
而就在春节前夕,MiniMax 开源新一代模型 M2.5,发布12 小时内登顶 OpenRouter 热度榜,一周内登顶调用量榜首,周调用量暴涨至 3.07T tokens。
这场纠纷的核心,聚焦于“模型蒸馏”这一AI行业常见技术的合法边界。
Anthropic在报告中强调,蒸馏本身是合法技术,通常用于企业将自身大模型压缩为轻量级版本,适配不同应用场景。但三家中国企业的行为,是将这一技术用于复制竞争对手的核心能力,以极低的时间和资金成本缩短与领先模型的差距,属于“典型的不正当竞争”。
然而,Anthropic的控诉并未收获行业一致支持,反而迅速陷入“双重标准”的舆论漩涡。
最直接的反驳来自xAI创始人埃隆·马斯克,他在社交平台X上嘲讽:“他们(中国企业)怎么敢偷Anthropic从人类程序员那里偷来的东西?”
马斯克直言,Anthropic自身曾大规模盗用受版权保护的书籍和软件开发者数据训练Claude,并为此支付了数十亿美元的和解金,如今却站在道德制高点指责他人,“伪善又虚伪”。
软件工程师格尔盖伊·奥罗斯指出,Anthropic无权“两头占便宜”,Claude的成功本身就建立在未经许可使用受版权保护内容的基础上,直到被起诉才向版权方付费,如今却对同类技术的使用大加指责,难以自圆其说。
更有人直言,模型蒸馏早已是行业内公开的常规操作,“这就像汽车厂商买来别家的车,拆开零部件研究结构、借鉴设计思路,目的是提升自身产品实力,而非‘偷窃’,Anthropic此举属于小题大做”。
有观点进一步指出,当前高质量训练数据稀缺,合成数据与蒸馏技术的边界模糊,很多企业都在探索技术的应用边界,Anthropic此次公开指控,更像是借助舆论打压竞争对手,尤其是在DeepSeek即将发布新一代模型V4的关键节点,难免有“借监管施压”的嫌疑。
截至发稿,DeepSeek、月之暗面、MiniMax均未对此次指控作出官方回应。
中国模型接连被针对
事实上,此次Anthropic的指控,并非是中国AI企业首次因模型蒸馏陷入争议。
就在本月12日,OpenAI向美国国会提交内部备忘录,明确指控DeepSeek通过复杂的混淆手段,绕过其安全防护对GPT系列模型实施蒸馏行为,这也是业内对DeepSeek蒸馏质疑的最直接公开记录。
面对OpenAI的指控,DeepSeek方面反问“如果真是偷的,上哪儿偷去?”,并强调自身模型的优势源于强化学习(GRPO)和稀疏专家系统(MoE)等架构创新,而非单纯模仿输出。
除了DeepSeek,此次被Anthropic指控的另外两家企业,也有过类似的行业质疑。
据公开信息,月之暗面在推出其旗舰模型Kimi时,就曾被质疑通过蒸馏Claude和GPT模型提升代码编写与长文本处理能力;MiniMax此前推出的对话模型,也因部分功能表现与Claude高度相似,引发过“技术借鉴过度”的讨论。
2025年9月,Anthropic在支付至少15亿美元和解盗版书籍训练纠纷的同一天,就曾宣布停止向中国资本控股的企业提供Claude服务,理由是防范“潜在的模型蒸馏风险”。
此外,Anthropic还明确呼吁加强高端AI芯片出口限制,认为这能从源头上减少此类蒸馏攻击。返回搜狐,查看更多
同类文章排行
- 为什么都认为无GC语言一定会比有GC语言要快?
- 如何看待西安地铁3号线近期的降速行为?
- 你见过最漂亮的欧美女性长什么样?
- 为什么16-28岁女性对labubu欲罢不能?
- 腰突怎么办25岁?
- 《士兵突击》中如果高城动用关系,史今能不能留下来?
- 2025年六月现在硬盘咋还涨价了呢?
- Go 语言的使用感受是什么?
- 你见过最恶心的邻居是什么样子?
- 用了几年大厂云服务器,现在想换便宜的,有推荐的吗?
最新资讯文章
- 你见过最恶心的邻居是什么样子?
- 为什么现在的年轻人更容易觉得疲惫?
- obsidian用一两年后会有多大?全文搜索还快吗?
- IntelliJ IDEA 中有什么让你相见恨晚的技巧?
- NextJS的全栈能力现在如何了?
- 数据库不就是增删改查一些数据吗?研发一个数据库到底难在哪了?
- 柳州的债务,谁来还?用什么还?怎么还?
- 放弃了微服务,我们为什么要重回到单体架构?
- 为什么大部分人都认为2560x1440是2K?
- 作为最后一个「香港四大才子」,蔡澜的离去是否标志着香港黄金文化时代的落幕?
- 孩子很努力但是成绩还是不理想是什么原因?
- 中国历史给你最大的感触是什么?
- 各位前端大触们,一般怎么定颜色的?
- 你觉得《捞女游戏》会因为不可抗力而被下架吗?
- 校招中的“熟悉linux操作系统”一般是指达到什么程度?
- 为什么“柴犬”从万人迷,变成万人嫌?
- 张伟丽可以打败什么级别的普通男性?
- 为什么 php 可以做到 7 毫秒以内响应,而 .net 做不到?
- Python+rust会是一个强大的组合吗?
- 为啥有好多人说 Arduino 是玩具?





