MoreRSS

site iconlukefan | 范路修改

硕鼠的博客站,互联网老兵,内容较杂。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

lukefan | 范路的 RSS 预览

美国AI监管盯上GPT-5.6,真正漏洞在哪?

2026-06-29 20:52:01

一张写着“AI监管方向错位”的大标题卡片,左侧是被锁住的模型立方体,右侧是地下蔓延的调度网络和安全漏洞节点,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

大家好,欢迎收听老范讲故事的 YouTube 频道。

美国监管方向错误,盯死了 Mythos、Fable 5 和 GPT-5.6,却忽视了真正的安全崩塌。

今天早上,老范怎么被炸醒的呢?这几天整个圈子都在眼巴巴地等着 GPT-5.6,尤其是 Fable 5 和 Mythos 5 被禁了以后,那咱就等着玩 GPT-5.6 呗,这是唯一的盼头了。而且它应该也不远了,原来说是这礼拜四出,结果没有出。现在据说是 200 美金的 Pro 用户,有一部分被抽签抽到了,进行灰度测试。

结果今天早上起来一看 X 上头,这个消息就直接把人炸蒙了:政府要监管 GPT-5.6 的测试名单,谁能进、谁不能进,谁能测、谁不能测,都要上报,要审批了。

那咱们今天就从这来讲一讲。你可能会问,之前被关的是 Anthropic 家的 Fable 和 Mythos,这把火怎么就烧到 OpenAI 脑袋上了呢?这里头的关键细节是,Fable 被禁了以后,Anthropic 自己跑出来就喊说:

GPT 也能干,你干嘛光禁我的呀?你得把它也封了呀。

这 GPT 就被拉下水了。从那一刻开始,这道门就从一家开始,向整个行业蔓延了。

所以今天老范要讲的一件事情就是:美国不是说不该管这个 AI,而是枪口的方向错了。它死死盯着的是模型,却没有看到脚下坍塌的是整套传统安全体系。

这条线分五层来讲:

  1. 这一个多月到底发生了啥。
  2. 为什么被关的模型不是要害,真正要害的是调度系统,特别在这里要讲一下 360。很多人说,360 周鸿祎的事你也来讲,这配吗?还是要跟大家讲一讲的,这里头还是有价值的。
  3. 一个少有人点破的真相:今天的安全,其实绝大部分不是靠技术,而是靠制度。
  4. 即使是最强的 NSA,也就是美国的国家安全局,几个小时就被 Mythos 打穿了,AI 调度凭什么能够这么厉害。
  5. 枪是打偏了,正确的方向到底在哪。老范的答案可能跟大家想的不太一样,甚至老范要讲的是,这可能是整个 AI 翻红、AI 上升的一个绝佳机会。

六个礼拜里,监管如何走进死胡同

六周时间轴上依次摆放国会警告、白宫草案、模型发布、泄露越狱、全球下线和名单审核六个节点,末端箭头拐进死胡同,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

首先咱们来数一数日子,满打满算 6 个礼拜,看看监管是怎么把自己拐到死胡同里去的。

  • 5 月 14 日,美国国会的众议员先抬手了。这次不是法案,而是警告,说前沿的 AI 我们得管一管。现在这个全村最靓的仔,每个人都惦记伸手去管一管。
  • 5 月下旬,白宫草案本来是很硬的,说我们要去设立一个草案,谁的模型想上线之前,必须要经过审批。但是被硅谷一通游说,特别是马斯克和扎克伯格上去游说去了,稍微软化了一点。同期 ENFORCE Act,增强海外关键出口国家框架法案,在委员会内过关,把一把很硬的刀先摆在桌上了。
  • 6 月 2 号,特朗普签署了相对比较软的联邦政府行政令,要求的是自愿送到国家来审核,不作为你上线之前的硬性要求。你不来审核,也可以上线。
  • 6 月 8 号,国防部更新了 1260H 清单,把阿里、百度都放到国家安全叙事里去了。
  • 6 月 9 号,Anthropic 发布的 Fable 5 和 Mythos 5,公众可以用到的最强模型就这么登场了。
  • 6 月 10 号,泄露越狱这个事就来了,把 Fable 5 的提示词直接扒出来了,把 Fable 5 直接给攻破了。
  • 6 月 12 号、13 号,商务部以国家安全为由,按照国籍断供,全球下线。72 小时神话就到此结束了,我们就再也用不到 Fable 5 了。我刚才还去看了一下我的 Claude,上头 Fable 5 还是不允许使用的。
  • 6 月中旬起,政府前脚关模型,外部的方法后脚就开始反打了。OpenRouter 的 Fusion、日本的河豚,把一堆旧模型编排一下,就已经接近 Fable 的能力了。

同时中国这边动作也不断。字节跳动放出了按周实时更新的新模型,叫豆包 Doubao-Seed-Evolving,这个模型是每个礼拜都更新,就没有版本号了,把调度往模型里边直接塞。剩下就是老牌的安全公司 360,也放出了对标 Fable 能力的安全模型,等于美国前脚关门,中国后脚就开始补位了。

  • 6 月 22 日,Anthropic 的谈判换人了,理念很强硬的 Dario Amodei 就被请下谈判桌。他还是 CEO,但是现在就换了他的一些合伙人上来,去跟华盛顿谈去了。据说是 Fable 5 快要给大家使用了。
  • 6 月 25 日,Anthropic 指责阿里的信就被公开了,中国蒸馏叙事正式定调。
  • 6 月 26 号,Fable 灰度测试的风声又起来了,说又有一部分人可以用到 Fable 了。我现在也在 X 平台上看到很多人在晒他们使用 Fable 的照片了。但是 GPT-5.6 那头,却装上了名单审核。

大概过去 6 个礼拜,就是这样一路走下来的。本来特朗普还是比较宽松的,结果拉扯来拉扯去,就把一个相对比较宽松的政府行政令,给搞成了现在这样的:这个不许上,那个需要监管,变成这样了。

而这恰恰是 Anthropic 自己一连串动作,加上几个关键事件,把这架天平最后压向了盯模型、卡名单、按国籍这样的一个错误方向。

被关的模型不是要害,调度系统才是关键

一个被锁在保险柜里的大模型方块旁边,真正发光的是外部工具、回滚、规划、验收组成的调度控制台,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

下边咱们来讲一讲,为什么这个方向是错的。被关的模型本身并没有那么重要,重要的是调度系统,360 就是一个活的样本。

美国把 Fable 5 和 Mythos 5 关了,现在又在卡 GPT-5.6 的测试名单,逻辑很简单:模型太强了,太危险了,咱把这强的锁起来,你们其他人不许用。就跟向中国封锁芯片这个逻辑是一样的。可是他锁错了。

Fable 5 之所以那么强,从来不是说只有底座模型强。它底座模型确实强,但是它实际上是一个很强的底座模型,加上 Anthropic 内化的一整套调度系统。

调度系统是啥?就是决定这个 AI 什么时候调用什么工具,走到哪一步,谁来干活,谁来验收,谁来进行规划,干活错了以后怎么回滚,滚到哪里去,这个就是调度系统。

证据也摆在这了。6 月份泄露的 Fable 12 万字的系统提示词,有一多半都是在讲怎么用工具、何时调用哪把扳手,真正讲性格的大概连 20% 都不到。让模型靠谱的不是它脑子有多神,而是外面整个的调度系统。

而调度最要命的一点是什么?它能够被专项调教。你拿不到 Fable 这样的全能模型,没关系,拿一个还不错的开源模型,盯着一个又窄又危险的领域往死里调,是能够出结果的。

360 是一个现实样本

360 就是这件事情最现实,也是最吓人的一个样本。360 是谁?中国老牌的网络安全公司,或者说中国老牌流氓吧,这么讲都没毛病。它自己其实也做了好多年的 AI,只是一直没做出多大响动来。但是你别小看它,它在安全领域里头深耕了几十年,手里头握着大量的安全数据、海量的真实攻防案例,还有几十年沉淀下来的攻防手段与经验。我相信即使大家觉得 360 是流氓,也会承认这一点。

现在它要干的是什么呢?特别顺理成章:找一个当下最好的开源模型,比如说智谱 GLM-5.2,把自己几十年的安全数据掏出来,做专项的后训练和强化学习,你就有一个专门的安全大模型了。再根据过往的经验设计一套专门的调度系统,而这套调度系统直接照着 Fable 那份泄露的 12 万字的提示词致敬一下,就能搭个八九不离十。

这套组合拳打下来,它完全可以在网络安全这一个领域里头做出一个很强的东西来。说我可以达到甚至超过 Fable 5 的水平,都没有问题。

老范打一个比方,大家就能够理解了。比如说 Anthropic 的 Fable 5,它算是什么呢?真学霸,能考上哈耶普斯麻那种学霸,哈佛、耶鲁、普林斯顿、斯坦福和 MIT。这种人进一些大机构如鱼得水,放在哪个岗位上都很快上手,发挥到最强。Fable 就属于这一类的模型,旗舰模型,真学霸。

可是我们现在没有真学霸,拿不到 Fable 了。那好办,我们还有小镇做题家。小镇做题家可能也能考上 985、211,底子其实也没有那么差。扔进到这种万金油的岗位里头,它未必能够比得过真学霸,但是你给它一套很有针对的特定岗位培训,它在这一个岗位上照样可以干得很漂亮。它差的是什么?是换岗位需要重新培训。它不像真学霸,走到哪都强。但是你让它专攻一块,它也是能够出一些很神奇的妖怪的。

360 干的就是把小镇做题家,也就是开源模型,往网络攻防这个岗位上往死里头专项调教。在这一点上,它的杀伤力完全可以不输,甚至超过那个被美国政府锁在保险柜里的全能学霸。

所以你看明白了没有?最危险的门槛根本就不在于拿不拿得到顶级模型,而在于有没有那套特别成熟的调度系统和相应的数据。而 360 这种安全公司,这套东西本来就是人家看家本领,现成摆着呢。你关了 Fable,那我来呗。

今天的安全大半靠制度,不是靠技术

一座企业大楼外层贴满审批表、密码规则、合规培训和权限流程标签,底部技术防线很薄,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

下一步,咱们来讲一讲真相。真相一:今天的安全大半靠制度撑起来,不是靠技术。

很多人都觉得,你这个攻防技术好一点,这个差一点,大家很多人都觉得谁的系统更安全,是因为谁的技术更好。要跟大家说,不是这样的,这个真的跟很多人理解的不一样。

你以为现在的大公司、大机构的安全是靠技术防住的吗?不是的。它很大一部分是靠规章制度,靠人事、靠流程、靠纪律管出来的。这个老范还是有点底气的,因为我原来这公司,猎豹移动,也是个安全公司。真正的安全事故里头,大概 60% 到 70%,根子压根就不在技术上,而是人,是操作人员失误,设了个弱口令,或者操作人员不守规矩。你这里本来不应该打游戏的,你把内网的机器连到外网打了个游戏,绝大部分的安全事故都是这么来的。

正因为如此,才得用一大堆的规则、一大堆的管理手段去把人框住。这不是谁的意愿,这是没办法。

你回想一下,你公司里头的信息安全平时啥样?大概率是定期改密码、签保密协议、做合规培训、申请权限走审批流程、年底来一次背景核查。这些几乎就是管理动作,不是技术防御。它防的是不小心,防的是守规矩的人偶尔犯的错。可对于一个铁了心、手里还拿着 AI 工具的对手来说,这个玩意的作用其实是非常非常有限的。

谷歌 GWS 的例子

你可能觉得小公司技术不行。咱给大家举一个技术天花板的例子,谷歌的例子。这个是我自己用得特别开心的一个工具,叫 GWS,Google Workspace CLI。做这个项目的工程师叫 Justin Poehnelt,在谷歌干了快 7 年,自己做的工具 GWS,用户非常喜欢。我自己的各台电脑上都装了,甚至我还去给其他朋友也装这个 GWS。

它干嘛使的呢?就是让我们的 AI 智能体也好,让我们的 Codex 或者其他的 Harness agent 工具,可以连接到 Google Workspace 上的各种产品去,比如说发邮件、写日历、处理联系人,在 Google Drive 上面去做 document 或者 slides,都可以,非常非常方便。这个东西一上去以后,很快几千个星就上来了,在 Hacker News 上就冲到第一了。

结果这哥们没两天被谷歌给开除了。原因很简单,因为他这个东西没有走法务和安全审批,还用了谷歌的商标。你如果是自己上去的,那没事,没人理你。你用了谷歌商标了,但是你没有走审批,没有走安全,那就不行。这个事就是违反了内部的规章制度。

在这兄弟被开除的前两天,谷歌刚在 Cloud Next 大会上宣布,官方自己也要做一套 Workspace CLI。就是我要干,你这不行,我给你干掉。

老范请大家细品一下,连谷歌这种技术强到天上去的公司,它管安全、管控还是要靠审批、商标政策、人事处分,而不是什么神的技术。今天全世界绝大多数机构的安全底盘可能还没有谷歌强呢,所以大家只能靠管理型的东西来搞定。

而现在更现实的是什么呢?就是想要这套老的安全体系整体做一次升级,太难了,太贵了。但是贵有贵的好处,待会咱们讲,这有机会。真的把全公司的代码、系统、流程都换成能够扛 AI 攻击的新架构,这个肯定是要花钱的。但是花钱不是坏事,花钱是好事。

所以老范说了,今天最该先动手的第一件事,特别朴素,就四个字:把比例调对

现在这个比例是失衡的,靠制度、靠人管的东西太重,靠技术真正能防的东西太轻。规章制度是用来管人的,可接下来真正动手的越来越不是人了,是一套会自己进化的方法。拿管人的工具去管方法,就像拿交规去管病毒一样。不是它不重要,是压根不在一个频道上。

NSA 被 Mythos 打穿,说明了什么

NSA 字样的高墙系统被一条由零散漏洞节点串成的红色路径穿透,旁边有 AI 调度器在快速连接工具和权限,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

那这套管理型的安全碰上真正的高手会怎么样?咱们来讲第二个故事。

你说谷歌强吧,有比它更强的没有?举个最极端的例子,技术上最强的肯定是美国国家安全局,全世界网络攻防的天花板。可就是这样的一个天花板,在测试里头几个小时就被 Mythos 给打穿了。

先把事说清楚,它这个打穿的过程是在一个测试上,并不是说 Mythos 自己上去干的。在安全测试的过程中,Mythos 是拿到了各种安全工具。但是原来 NSA 的人想着,你怎么着得干个几个礼拜吧,或者干个几天,结果一晚上就穿了。

你要知道,任何一个大的系统里头,漏洞本来就是一直存在的。不是说你是 NSA,你就能把漏洞都补干净,没有人做得到这件事情。那平时为什么还安全呢?两件事:

  1. 这些漏洞是很零散、很孤立的,没有人能把它串起来。
  2. 外面还罩着一层层规章制度和规则,谁能进,谁有权限,哪步要审批。

靠漏洞没被串起来,再加上制度罩着,系统勉强还是可以维持安全的。

但是 Mythos 干啥呢?它就是把这套本来零散、孤立的大量漏洞,一个一个串起来,组合成一条条原来谁都没有想到的全新攻击路径,然后顺着它绕过制度,直接钻进去。

这就是一句老话:找一个漏洞不难,难的是把一堆漏洞串成一条完整的攻击链。人脑是串不动的,人脑其实有点像狗熊掰苞米,掰一个掉一个。我们不可能同时把这么多代码都记在里头,但是 Mythos 背后这套调度系统,是完完全全可以把这些东西串起来的。

社会工程学才更无解

而且这里头还有一个问题,这都是技术漏洞,这只是事情的一半。真正让老范觉得这事完全无解的是什么呢?是社会工程学,我们管它叫社工。

什么是社会工程学?说人话就是利用人的社会性下手,骗、套、伪装、钓鱼,把人当成系统里头最好攻破的那一环。今天一大半的安全事故,本来根子就在这,不在代码里,就在人身上。

这里头还藏着一个特别致命的结构型漏洞。一个大型系统,比如像 NSA 这种系统,它是一次做完的吗?或者一次整个重新翻过来的吗?不是的。它是一次一次升级升上去的,一次一次打补丁打上去的。你永远没有办法把所有的漏洞都找齐。那怎么办呢?只能靠测试、验收、认证这套东西来兜底。我这次打了补丁了,做一堆验证,做一堆测试,它这么来干这个事。

可是问题在哪呢?就是它的测试过程测的是技术问题,它不会去测社会工程学的问题。一个员工会不会被一句话就忽悠到去点开一个链接,会不会被伪装的领导骗去转账,这种事情是没法去测试的。你测这玩意就没完没了了,只能靠管理制度去防。

所以社会工程学这一块,本来就是技术帮不上忙,只能交给管理的地方。但是现在比较瘆人的是什么呢?攻击系统的是 AI,是 Anthropic 这套模型。这套模型最擅长的是什么?不是找漏洞,不是一个一个把漏洞串起来,它最擅长的一件事是一本正经地胡说八道。在这样的一个底座上,它还能找到漏洞,在串的过程中完完全全可以把社会工程学的东西都用起来。那你想吧,当它串了漏洞,再编瞎话骗人,把这两样东西拧在一起的时候,技术这条线怎么可能能够挡得住它?

AI 加调度,是绕过免疫系统的超级病菌

一株会变形的超级病菌绕过盾牌形免疫系统,触手分别连接漏洞扫描、钓鱼话术和自动试错三个模块,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

那它凭什么能够同时干两件事?Mythos 这种东西,它是 AI 加上调度,这个东西才是真正强的东西。

为什么 AI 加调度这么狠?它是绕过了免疫系统的超级病菌。老范给大家讲一个最直观的比方吧。人体本来是一个免疫系统,一种病毒来了,你识别它,记住它,产生抗体,下一次你就能扛住。传统的软件安全就是靠这套免疫加疫苗的逻辑,发现一个漏洞,分析,打补丁,全网升级。它对付的是已知的、固定的病毒。

可现在出现的是另外一种东西,有人定向培育了一个超级病毒。它最可怕的不是毒性,而是它会进化,而且是冲着你的防御系统来进化的。这就很吓人了。

我记得以前玩过一个游戏叫《瘟疫公司》。你扮演一个病菌,人类每出一招,比如关闭边境、研究疫苗,你就顺着应对的方向去进化。long is your?一开始要有传播力,但是不要有那么强的伤害力,让它可以慢慢潜伏下来。等它传遍了以后,特别是像冰岛这种与世隔绝的地方都传上了以后,你再嘁哧咔嚓把剩下的所有点都加到破坏力上。这个游戏胜利的方式就是全人类灭绝,一个都不剩。这个稍微有点吓人。

但是 Mythos 是完全跟这一套系统一样的工作方式,现搬到网络攻击上。一套足够强的攻击型调度,能够像那个玩家一样,实时盯着安全系统的标准应对,自动调整攻击链的方向。你这边按照老剧本去打补丁,它那边已经绕着你的疫苗,进化了三四条新路出来了。

为什么传统免疫一定扛不住?有两个硬的原因。

  1. 速度差。你打补丁是人在调节,你需要发现、分析、测试、推送,几天、几个月就过去了。它的攻击是机器的节奏,一晚上可能试几万种组合。用人的时间秒去追机器,你打死也追不上。
  2. 认脸跟认路。传统的防御是靠认脸的,拿着病毒特征库来一个一个去对比。可是像这种攻击系统,它每次都可以现编一条你库里没有的新路,编一条新的瞎话上来。这对于 AI 来说多容易。你原来认脸的这套东西,碰到这种认路的,就很容易被绕过去。

而这个事情已经不是吓唬你了。前面 360 拿安全数据做专项调教,豆包把调度直接缝到每周进化的模型里头去,都是这株超级病菌正在被一家家造出来的一个信号。危险不在于某个被关起来的特别强大的模型,而在于这套会进化、还能够连人带机一起来骗你的调度系统。而这个调度可蒸馏、可复制、可开源,这个东西你是防不住的。

美国开错枪了

一个监管者把聚光灯和枪口对准写着模型名称的靶子,真正的调度网络从脚下暗处绕开扩散,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

所以说美国开错枪了,找错目标了。它对准的是模型的名字,这个东西叫 GPT-5.6,那个叫 Anthropic Claude Mythos,这个叫 Anthropic Claude Fable,都是这样的东西。我们把这个模型限制住,然后限制国籍,只有美国公民才可以用,其他人都不可以用;或者我开一个名单,我审核过的名单可以用,其他人都不可以用。这个对于政府来说,他们就习惯这套东西,这个是最好听、最好盖章,却最没有用的东西。

中国模型已经很强,图纸也在泄露

为什么这样呢?第一个,中国模型其实现在已经很强了,图纸也在不断地泄露。靠蒸馏 OpenAI 和 Anthropic,中国这批新的模型,比如智谱 GLM-5.2、MiniMax M3、Kimi 的 K2.7 Code、豆包的 Seed 2.1 Pro、豆包的实时更新,还有千问的 3.7 Max,这些模型已经非常非常强了。虽然比不上 OpenAI 的 GPT 和 Anthropic 的 Claude,但是干很多事情没有问题了。

更要命的是什么?Anthropic 自己还接二连三地漏底。去年 Claude Code 的全套源代码泄露了一次,泄露完了以后,像 open code 一大堆这样的产品就出来了。今年 3 月份,Claude Code 51 万行代码又被完整泄露了,打包错误嘛。6 月份 Fable 的 12 万字提示词又被扒了个干净,上传到 GitHub 上了。源代码、提示词,等于把这套调度系统的图纸直接摊在全世界面前了。拿着图纸,再加上中国工程师的勤奋以及人员密度,加在一块,实际上叫内卷吧。以及中国工程师的内卷程度,想搭一套可以调度的系统,难度真的没有那么高。

按国籍设卡,相当于自废武功

第二个更根本的是什么?你按国籍,相当于自废武功。别忘了,美国本来就是个移民国家,它跟中国还不一样。虽然咱们有 56 个民族,但是有百分之九十几都是汉族,我们基本上属于是民族国家。美国是移民国家,它的 AI 大厦一大半都是外籍人才垒起来的。

比如像 Andrej Karpathy 这样的人,人家是斯洛伐克出生,现在拿的是斯洛伐克和加拿大的双国籍。按照美国商务部的要求,他都不能使用他们公司的 Fable 5 和 Mythos 5。而且现在各大 AI 公司里头哪的人最多?中国人最多。你说靠国籍、靠国籍准入来去封锁,第一,肯定不现实;第二,这个本来是美国最有优势的地方,它可以吸引全世界的顶尖天才去做事情,现在它把这个优势放弃掉了,说不,我只让美国人做,这不就是本末倒置了吗?

这里还有一个特别生动的例子。马斯克当时建 xAI 的时候,创始团队十几个人,拿符合美国军工那套安全要求,比如说美国国籍,没有几个人能过关。后来 xAI 被并进 SpaceX 的时候,SpaceX 因为要接 NASA 和军方的订单,安全门槛一把就拉死了,结果 xAI 最初始的创始团队一个都没剩下,全走干净了。当然,这可能不是全部的原因,但是安全和国籍门槛肯定是创始团队出走的原因之一。

所以你看,门槛往那一拉,人才就走了。美国之所以强,靠的就是把全世界聪明人都吸引过来。现在为了安全按国籍设卡,等于亲手把自己最大的优势直接给嘎掉了。

限制铁锅的历史类比

讲到这,老范给大家补一个几千年来中国人一直在犯的问题,就是限制游牧民族买铁锅,当然还有其他铁器。逻辑其实跟今天这事一模一样。

游牧民族生活的地方其实是有铁矿的,但是他们没有燃料,没有煤,也没有木材,只有草,它是不可能靠草把铁给冶炼出来的。所以当时的中原地区王朝就想说,那我卡住你不就完了吗?你没有铁器,你就没有兵器,你就不能劫掠我,不能给我捣乱了。

咱们执行了上千年的禁铁这样的一个规则,但是有效吗?其实没有效果的。商人在不断地把铁器偷偷地运到那边去,几千年来从来就没有停过。这些游牧民族拿着这些比较劣质的铁器,也是一次一次地把咱们摁在地上摩擦,一次一次进来劫掠,甚至还有两次灭国,元朝一次,清朝一次,直接把汉家江山给断掉了。

所以就算是咱们执行了这么长时间的铁器管制,其实是没有效果的。美国今天想干的事,跟当年那套限制铁器、靠卡住几个最强模型来保住自己的安全,其实是一样的。这条路几千年前就被我们已经走废掉了,说明了这事搞不定。

正确打法:跑起来,造新的疫苗

两条赛道上攻击方和防御方的 AI 调度系统同时高速奔跑,防御方手里制造发光疫苗盾牌,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

既然封不住,真正的打法到底是什么?你说难道就只能看着中国在这超越吗?最后一节咱们来讲这个事。正确的打法肯定不是捆住自己,而是跑起来,去造新的疫苗。

先排除错误答案。有些人说,那既然模型很强,我把模型封了;这个数据很强,我把数据封了;这个调度系统很强,我把调度系统也封了;我把所有东西都封了,这不就没有了吗?你可以把所有的动作去做记录,可以去做事后追溯,这个事可能还有点意义。但是如果你说我想靠封,靠层层设卡、层层审批,那只能捆死自己的手脚。

真正对的打法是反过来,比谁更开放,谁更创新,谁跑得更快,谁更愿意把最新最强的模型拿出来,更能够造出更好的防御来。大家就应该比这个。

你看硅谷有一拨人在 X 上面的签名最后是 e/acc,意思是有效加速主义。核心就是一句话:先跑起来。对手在追的时候,你唯一该做的就是继续往前冲,而不是回过头来把自己捆住。做那个最开放的,把全世界最优秀的人才吸引过来,做出最新的东西,这才是真正的防护。靠关门、靠设卡求安全,现在再想肯定已经晚了,早几年没准这事还有效,现在没戏了。

那跑往哪跑呢?老范给出的答案五个字:靠 AI 防 AI。造出新的疫苗来。

旧的免疫系统挡不住会进化的超级病菌怎么办呢?唯一的出路就是造一套相同的会进化的、同样机器节奏的新防御系统。让防御方的 AI 调度去 24 小时自动巡检、自动修补、自动做红队攻击,跟攻击方在同一张时间表上去掰手腕。

而且老范要讲什么?这不该是负担,而是天大的机会。

新的千年虫时刻

1999 年的老式电脑、硬盘阵列和光盘库被升级箭头连接到现代 AI 安全产业工厂,旁边标注“新千年虫时刻”,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

大家还记得曾经有一个神奇的东西叫千年虫吗?在 1998 年、1999 年那一波 IT 大爆发,我在那个时候在中关村卖存储设备,卖硬盘阵列,卖光盘库,那时候简直是卖疯了一样。当时一喊千年虫,大家就必须要买。

什么叫千年虫?很简单,最早为了省内存,我们表达一个数字只有两位,就是最后两位。52 就是 1952 年,82 就是 1982 年。结果你过了 2000 年的时候,就是 00。对于原来的电脑来说,00 就相当于是 1900 年。比如一个银行,给人算利息,刚存进来的钱,00 年存的,你说给人算多少利息吧?100 多年的利息吗?这没法算。银行、电力、航空,这事要乱套。这个就是一个非常具象的名字,叫千年虫。

为什么要讲这事非常具象呢?完全不懂技术的人都能够一眼看明白威胁到底是怎么回事。于是怎么办呢?全世界像疯了一样去更换、去迭代、去重构、去升级他们的 IT 设备、IT 系统,需要的和不需要的通通都换一遍。

我们当时卖了大量的设备出去,他们压根就不需要换。其实从九几年开始,他们写的程序都已经是 4 位的年数了,就已经不是两位的年数了。那不管,反正有机会花钱,别人都花了,别人有的我也得有。整个 IT 产业借着这股力、借着这股劲,硬生生地上了一个大台阶。

所以我要说,我们现在面对的就是一个新的千年虫时刻,而且这个威胁比当年要真实得多,也可怕得多。那何不把它变成一次大的爆发的引擎呢?把大量的社会资源投到 AI 安全这个产业里边去,制造新的疫苗,建设新的防御,用 AI 来防御 AI,让整个 AI 产业再迎来一次像千年虫之前那样的巨大飞跃。这才是把今天这个有点吓人的故事讲成一个正向、积极过程的唯一办法。

结语

美国现在做的恰恰相反。它在关门,去应对一个本来应该奔跑去应对的危险。它把最显眼的那扇门焊死了,惊动了所有守规矩的人,甚至损害了所有守规矩的人。可真正的危险,正从开源、从泄露的图纸里边、从一个个被逼走的人才身上,慢慢浮现出来。

门是焊不死的。与其追着去关那道关不严的门,去层层设卡,还不如赶紧低头,去造下一代的疫苗。能不能把这场惊吓变成下一轮的繁荣,就看我们是选择捂住、封住、关住,还是选择跑起来、造出来、赢回来。

这就是咱们今天要讲的故事。

中国超算重回全球第一,超算和AI算力中心不是一回事,英伟达为什么在这一块不灵了?

2026-06-29 08:56:07

中国超算灵晟重夺世界第一,怎么总觉得哪里不对呢?

中国超算灵晟以巨型机房轮廓站在世界排行榜顶端,旁边是被挤到第二位的美国超算标牌,前景有主持人拿着问题清单观察榜单,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

大家好,欢迎收听老范讲故事的 YouTube 频道。

前两天,也就是 6 月 23 日,在德国汉堡,全球超算一年两度的“华山论剑”——TOP500 榜单更新了。榜首换人了,一台叫做灵晟的中国超算悄无声息地空降第一,把霸榜一年多的美国机器 El Capitan 挤到了第二。

这是自 2017 年神威太湖之光之后,时隔 8 年多,中国超算重回世界第一。大家第一个上来喊“遥遥领先”吧?这个事跟遥遥领先还是有点关系的。第二个,有人说这不就是 AI 算力吗?还真不太一样。还有人说,谷歌呢?微软呢?他们怎么不来?怎么让中国这样的一个公司就冲上来了?这个机器、这种超算,难道把它运到德国去跑吗?大家都知道这种超算都挺大的。如果不到德国跑,那它怎么算的分数呢?

咱们把这个事跟大家稍微掰扯掰扯:这到底是个什么比赛,考的什么题,这个题是算什么的,程序是谁写的,成绩是怎么去验证的,这个机器到底有多大、多费电,以及现在这个超算跟 AI 到底是不是一回事。谷歌、微软、xAI、美塔、Oracle 都在这拼命地建算力中心,那咋中国的机器就跑去夺冠了呢?怎么觉得不对呢?中国还有多少这种超算?平时这些机器都干嘛的呢?最后,咱们再讲讲 AI 跟这种超算之间到底是怎么结合的,英伟达能不能顺手把这活干了呢?

TOP500 到底比什么?

一张写着 TOP500 的全球成绩单放在桌面中央,LINPACK 试卷、Rmax 实测仪表和 Rpeak 理论峰值气球并列对比,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

首先要说清楚,这到底是一个什么样的比赛,考的是什么题。这个比赛叫 TOP500,它实际上是一个民间榜,从 1993 年开始办,每年 6 月份和 11 月份各发一次,是超算界的高考成绩单。只考一道题,叫做 LINPACK。说人话,就是解一个超大规模的线性方程组,每秒能够做多少次浮点运算,就考这玩意。

这里头要牢记两个词。一个叫实测,英文叫 Rmax,不是厂家吹的理论峰值 Rpeak。Rmax 就是说你要跑这个题,而且要跑稳定,跑很长时间。灵晟实测是 2.198,峰值是 2.736,压榨出了八成的算力,这已经是非常非常强的了。

另外一个词是双精度,FP64。这个数咱们先记着,后边咱们再仔细讲它跟现在的 AI 算力到底有什么区别,就差在这数上了。

FP64 这道题到底在算什么?

飞机机翼被切分成密密麻麻的小方块网格,每个方块之间用箭头连接表示气压风速温度互相影响,旁边有 FP64 精度放大镜查看小数位,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

那么这道 FP64 的题到底算什么呢?咱们打个比方吧,一架飞机机翼周围应该有气流,我们要用计算机把空气切成几十亿个小方块,每一块的气压、风速、温度都由旁边几个方块来决定。你推我,我顶你,大概是这样的一个过程。

几十亿个方块就有几十亿个相互咬死的方程,必须同时解出来。走完了这一帧以后,你要再解一次下一步怎么样了,要反复算几万次、几十万次,这就是 LINPACK 这道题的真身。

为啥是 FP64 呢?就是它要求的是准,一定要准。因为 FP 后边这个数越高,说明小数点后边留的位数越多。我留得多了以后,最后就可以把误差算得相对比较小。

刚才咱们讲了,这个东西要算几十亿个小方块,里头要迭代几万次,一次模拟上万亿次的运算,一次模拟上万亿次的计算,误差会滚雪球,这个东西叫累计误差。低精度算到后边,模拟的飞机自己在电脑里就散架了,根本就飞不起来。它这个东西必须要特别准,到小数点后十几位的双精度,所以要用 64 位。记住这个“准”字。

TOP500 分不分量级?

那这台机器到底有多大呢?或者说这种机器分不分量级?咱们前面讲过张雪机车的故事,它这个机车比赛是分量级的。你去拳击比赛,也是分量级的,你不能找个大胖子跟人小瘦子去打。

这个 TOP500 分不分量级呢?要讲清楚,这个比赛是不分量级的,没有任何限制。所以这种比赛天然偏向于不差钱的国家队,你做的机器越大、越费电、越烧钱,你的得分就越高。基本上大家可以把它理解成不分重量级的拳击比赛。

当然它也有另外一个比赛,叫 Green500,叫绿色 500,它要计算能效比,就是我的 1 瓦到底能够算出多少次来。在这点上,中国这个机器灵晟比美国那机器就差好远了。

灵晟到底有多大、多费电?

92 个超算机柜排满机房大厅,粗大的电缆连接变电站和液冷管道,电表指针指向 42 兆瓦,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

讲到这,机器肯定是巨了的个。这机器到底有多大呢?首先我们先说它的计算速度,是每秒 2.198 百亿亿次双精度。大家知道这数就完了,不需要细究这数到底有多大,反正现在这就是世界最快的了。

它使用的叫 LX2 处理器,一颗处理器上是 304 个核心,每两颗处理器是一个节点,2 万多个节点,4 万多颗 CPU,一共是 1,379 万个核心,装 92 个机柜,基本上可以摆满整个机房大厅。

这个东西肯定是耗电魔兽,这台机器满负荷是 42 兆瓦,跑一年 3.7 亿度电,电费 2 亿多,还得按中国的电费算,还得给它专门配变电站和整套的液冷系统。所以这个东西就是中国这套大力出奇迹的典范。

成绩怎么提交和验证?

超算成绩从本地机房上传到德国评审桌,四道闸门依次标注误差验算、统一尺子、现场核查和声誉约束,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

那你说这机器我能把它运到德国去吗?肯定都不会。你把这机器运到德国去,它连电我估计都烧不起。所以这种机器是在自家跑,提交成绩,然后官方来抽查,通过这样的一个方式去参加比赛的。1993 年起一直是自愿提交的一个状态。

那你说有没有人作弊?怎么能够保证提交的数据是准确的呢?有四道闸门。

  1. 第一道是题目自带验算,算完了以后自动核对误差,必须小于 16,超过了成绩就直接作废了。所以算错了自己就被毙掉了,算不对这事是不行的。
  2. 第二道是题目判分全球统一的一把尺子。
  3. 第三道是官方保留独立的核查权,还会随机地抽样,要求安装现场跟委员会直接对接核实,无效的、非通用的直接踢出榜。
  4. 最后是声誉。这个圈子不大,如果你作假掺水被扒了,丢的就是整个机构和国家队的脸,所以通常大家还是会相对比较小心的。

而且耗电也是有标准的,因为后边还有 Green500 的这种分级。L1 测全机,还有一个就是 1/64 节点的外推,L2 是 1/8,L3 是整机连网络存储实测。所以超算比赛更像是交一份可复现、可抽查的实验报告。

第二名 El Capitan 是什么机器?

灵晟纯 CPU 阵列与 El Capitan 的 CPU 加 GPU 混合阵列并排站在领奖台上,旁边用电量和性能柱状图显示取舍,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

再说第二名,美国这台 El Capitan 是一台什么样的机器呢?它是美国劳伦斯利弗莫尔国家实验室的机器,由惠普 Cray 制造,1,134 万核,大概是 29.7 兆瓦。它这个机器主要是干嘛的呢?主要是模拟核爆的。

刚才咱们讲,这个劳伦斯利弗莫尔国家实验室是美国能源部的实验室,就是做各种核实验的实验室。现在不让真的去做核试验了,那就只能在电脑里炸了。

它跟咱们的机器最主要的差别在哪呢?咱们这台灵晟是全 CPU 的机器,里头是没有 GPU 的。而惠普造的这个 El Capitan 是一半的 CPU、一半的 GPU,它实际上是 AMD 的算力核心,所以有 CPU 加上 GPU 二合一的这种加速芯片,里边用的是 MI300A APU 的这种芯片。这个芯片对中国也是禁运的,它靠 GPU 加速运算,所以差距就差距在这了。

灵晟是纯 CPU,1,379 万核,42 兆瓦,2.198,它是第一名。而 El Capitan 是 CPU 加 GPU,1,134 万核,29.7 兆瓦,1.809,它是第二。但是耗电我们也比它耗得多,灵晟多耗 4 成电,换来 2 成的性能提升。赢,在绝对值上肯定赢了,但是从能效上来说,稍微差那么点意思。

但是灵晟有一个比较强的地方是什么?全国产,CPU 也是国产的,操作系统也是国产的,就是费点电吧。

灵晟的 CPU 是什么来头?

既然这个机器是全国产的,那我们就关心它这个 CPU 到底是一个什么样的情况。首先要说,这个 CPU 不是 X86 架构,也不是 RISC-V 架构,这个 CPU 是 ARM 架构,Armv9 架构的。大家注意,Armv9 的所有专利,华为都已经得到授权了,它在没有 ARM 新授权的情况下,可以继续使用 Armv9 架构去设计新的芯片出来。所以这事跟遥遥领先还是有关系的。

这颗芯片是华为参与设计,与鲲鹏系列芯片是一脉相承的。每颗 304 核,由两颗小芯片拼起来,32GB 片上 HBM 加上最多 256GB 的 DDR5 内存,把这玩意放在一起来使用。现在中国你说能有 HBM 吗?也有,就是稍微低一些。咱们现在长鑫存储也是可以做出这东西来的。

那为啥不要 GPU 呢?为啥全要 CPU 呢?它这个核里边内嵌了 ARM 的向量和矩阵单元,所以 CPU 里头干一部分 GPU 的活也是可以干的。在 GPU 的运算上,它叫够用,但是不能算碾压吧。

至于说这个芯片是谁代工、谁做出来的,官方并没有公开。但是华为参与设计,大概率不能在台积电去代工了,因为台积电现在不给咱们做了。所以它大概率还是在中芯国际做的 7 纳米芯片,也怪不得耗这么多电嘛。

那你说我能不能买一个 LX2 的 CPU 来使呢?这个东西是买不到的,因为这个 CPU 是专门给超算来设计的。但是你说我现在想用华为 ARM,也就是鲲鹏的架构,去做自己的服务器,行不行?这个也是可以的,这个芯片是有卖的。所以这个 LX2 算是特种定制款,但是它这套体系,就是鲲鹏这套体系,大家是可以买得到的。

这跟 AI 算力是一回事吗?

左侧 F1 赛车标注 FP64 精准科学计算,右侧万人货运车队标注 FP16、FP8、FP4 的 AI 吞吐量,两条赛道分叉前进,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

下一件事,你说大家现在拼的都是 AI,都是英伟达,你做了一个这样的东西到底为啥?这跟 AI 有什么关系没有?或者微软、谷歌他们都哪去了?它参加这比赛,不是把中国队碾压了吗?

这要讲清楚。首先微软来了,微软是在微软云里的一台机器去参加了比赛,得了第 32 名吧,反正名次很靠后。谷歌确实没来参加,因为这事跟它没关系。但是要注意,AI 算力跟我们现在讲这超算,是完全两个不同的概念,算的题不一样。

刚才还记得咱们强调那数吗?FP64,它要求的是准,不能有误差,或者误差尽可能要缩小。而 AI 玩的是什么?玩的是快和多。AI 上来了以后就是 FP16,只有 16 位的浮点数,甚至还有 FP8。咱们最新的,比如像 DeepSeek V4,包括现在新的英伟达 GB300 以及华为的昇腾 950 这些芯片,人家玩的是 FP4。我只在 4 位的浮点数上去算,这样就可以同时算更多的数。我不需要你给我算这么准,这么小的误差,差不太多,我只要把这么多的向量算在一起,我就可以得到结果了。所以这完全是算两个不一样的东西的。

让它们这个比赛也会进行这种混合精度计算。混合精度的时候,美国那台 El Capitan 里头塞满了 GPU,它就可以得冠军。但是你说我不算这个低精度的,我就算 FP64 的,那咱们就比它强。

所以超算有点像 F1 赛车,单点登顶,就追求极致的精准。AI 中心有点像万人货运大队,几万张 GPU,求的是吞吐量。但是这个细致的活,你就别找我了。

中国这些超算平时干什么?

中国地图上分布深圳、天津、广州、无锡、济南、郑州、昆山等超算节点,每个节点连向天气、油气、生物医药、海洋和工业设计图标,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

那咱们这台机器干嘛使的呢?刚才咱们讲了,美国那台机器是玩核爆的,咱们这台机器来自于深圳超算中心。深圳超算中心其实主要是算天气的,天气预报,各种天气的长期模拟和仿真,主要干这个使的。

中国还有很多的这种超算中心:

  • 天津超算,里边有天河一号、三号,算石油、航天、生物医药、可控核聚变、高端装备和动漫,有时候也给人做一点渲染。
  • 广州是天河二号在这里,一号、三号在天津,二号就在广州了。这边主要是计算生物医药、汽车、造船、影视动漫、金融、核电、海洋、公共安全。
  • 无锡是神威太湖之光,也就是 8 年前咱们夺冠的那个机器,是首台全国产芯片的冠军。这个主要是算海洋、油气、气候、工业设计、动漫渲染。
  • 济南那台机器叫神威蓝光,算海洋、现代农业、油气、药物筛选和金融。
  • 郑州叫嵩山,这种机器都有名字,主要是做数字经济、精准医学、生物育种、环境和 AI 方面的这种运算。
  • 昆山还有一台,那是长三角大科学装置,AI、生物医药、材料、大气、海洋,做这方面运算的。

所以中国是有一套网络,骨子里边是给产业、科研当水电煤来使用的。美国是把最强的机器供起来做绝密国防的,这个是两个不同的模式吧。

AI 和超算到底怎么结合?

超算先生成天气和地震仿真数据,数据流进入 AI 模型训练炉,最后变成一本九九乘法表交给小学生机器人快速回答问题,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

很多人就说,这 AI 跟这种超算到底是什么关系呢?我在这上跑大模型行不行?肯定不行,这上跑大模型会跑得慢死的,因为里头没有 GPU,全是 CPU。

那你说我什么时候用超算,什么时候用 AI 呢?其实在这种配合上有两步。

  1. 第一步,你可以用 AI 去写程序,写完程序以后到超算上去跑,这个事是没问题的。AI 写程序的效能很高,比人高个好几倍。但是当你需要这种要求非常精确,要求去做双精度 FP64 运算的时候,你就要写好程序,让超算去跑了。
  2. 第二个其实特别好玩。很多人都讲蒸馏,我们去蒸馏 Anthropic,我们去蒸馏美国大模型了,甚至还有人跑来蒸馏中国模型,都有。那你说这些模型蒸馏谁,大家想过没有?比如说 Anthropic 的模型,我要去蒸馏谁?它去蒸馏超算。

什么意思呢?就是超算可以仿真地震、天气、核爆,做一大堆的仿真数据以后,直接把这些数据塞给 AI 大模型,让它把这个数据吞进去,训练了以后,你下次问这个 AI 大模型说,来,给我仿真一下核爆了以后会怎么样,它会快速地给你得出一个结果,而且这个结果相对来说还比较准确。

这个有点像什么呢?就是你上超算计算出一大堆的结果来,然后总结规律,变成这个九九乘法表。然后你让旁边的一个一年级小朋友说,来,把九九乘法表给我背下来。背完了以后说,给我算一下这个几乘几,啪就给你算出来了。它是这样的一个工作方式,这就是 AI 跟超算之间相互结合的玩法。

英伟达能不能顺手把这活干了?

那有人说,上英伟达是不是可以碾压国内这台灵晟呢?还不行。英伟达现在为了能够进行更高效的 AI 运算,也就是低精度的高并发运算,它故意阉割了自己 FP64 的能力。现在英伟达的 GB300,它在 FP64 上的能力比它早期的这些芯片还要次,还要再差一些,这个就是不同的进化方向。

总结

最后咱们总结一下。

  1. 灵晟这个第一含金量还是很高的,全国产、纯 CPU、ARM 架构、双精度第一。但是在几纳米、在制程上,人家也没说,这个咱也别替它胡吹。
  2. 别被世界第一带偏了,它赢的是科学计算这条道,跟谁家 AI 强是两个完全不同的赛道。
  3. 未来也不是二选一,要么玩 AI,要么玩科学计算,不是这样的。是各自做各自擅长的事情,AI 去编程,让超算去跑,超算跑出结果来,再回去训练 AI,它是这样的一个运作方式。

所以灵晟能够在时隔 8 年之后夺冠,确实是我们做出了巨大的努力,这是值得肯定的。但是也不要上来就喊遥遥领先,我们什么都强,我们还是要理性地来看待这件事情。

好,今天这个故事就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加 Discord 讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片

Elon Musk生日快乐,SpaceX收购Tesla,路上的5个问题。

2026-06-28 08:52:15

马斯克站在生日蛋糕形状的地球旁,左侧是火箭公司标志化火箭,右侧是电动车与机器人,三者被并购箭头连接成一张商业关系图,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

在马斯克55岁生日这一天,我们来讨论:SpaceX到底什么时候吞并特斯拉?

大家好,欢迎收听老范讲故事的 YouTube 频道。大家看到这个节目的时候,应该就是 6 月 28 日,也就是老马的 55 岁生日。原来大家猜测 SpaceX 会在这一天上市,但是老马等不及了,6 月 12 号就把 SpaceX 给轰上市了。

为什么等不及呢?原因很简单,现在的股市波诡云谲。你看看每天蹭蹭蹭往上涨,蹭蹭蹭往下跌,这个速度实在是太快了。美国还有比较多的公司在上面折腾,像韩国这种,今天向上涨熔断,明天向下跌熔断,现在这个股市已经疯了。所以在这种情况下,早上市一天都是好的。

而且它上市了以后一顿骚操作,股票开市即巅峰,后面哗哗掉下来了,导致 OpenAI 说:

咱再等一等吧,咱明年上吧。

6 月 28 日,老马生日这天,咱们来讨论一下合并的事情。咱们分五个问题来讨论,看看有没有大家关心的问题。

  1. 马斯克自己到底愿不愿意合并?
  2. 他为什么一开始不合并,上市完了以后,圈完了钱、割完韭菜了,还惦记合并呢?
  3. 到底谁吃谁?是 SpaceX 合并特斯拉,还是特斯拉合并 SpaceX,或者建一个中间公司把它们两个都管起来?
  4. 合并的时候最重要的是什么?也就是股价怎么对价,特斯拉几股能够换成 SpaceX 一股,或者双方按什么股价合并。
  5. 如果真的想合并,谁会卡住它?谁会把这事摁停下来?
五个编号问题像路标一样排成弧线,通向中央一枚火箭与一辆电动车重叠的并购终点牌,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这个故事适合两类人来听。第一类是投资者,不管您是 SpaceX 投资者,还是特斯拉投资者,都可以听一听。但是本频道从来不做具体的投资意见和建议,赚了是您自己的,亏了不要来骂我,这是要跟大家讲清楚的。

第二类,是喜欢科技的人。对于航天、无人驾驶、机器人、AI 感兴趣,那这个故事也适合您来听一听。

下面我们就来依次分析这 5 个问题。

第一个问题:马斯克到底乐不乐意合并?

大家要注意,最核心的决策者就是马斯克自己。如果他不想合并,谁摁着他也没用;如果他想合并,8 头牛也拉不回来,他就一定能合得成。所以先看看马斯克乐不乐意。

2016 年 8 月 4 号,马斯克亲口说:

没有理由把 SpaceX 跟特斯拉合并,这两家公司之间的关系非常脆弱。

这是特斯拉 2016 年 Q2 分析师电话会上的原话,摩根士丹利提问,当场被否认了。

2024 年 SpaceX IPO 路演材料里头还写着,说在可预见的未来,不打算向 A 类股东派发股息。什么叫 A 类股东?就是上市以后买 SpaceX 股票的散户和机构,他们叫 A 类。B 类就是 10 倍投票权,是由马斯克和内部人员持有的这些股票。

什么人会分股息?我需要拉市值,这帮人会分股息。比如苹果、谷歌、Meta,它们过一段时间就是我回购吧,我分红吧。它为什么干这个事?一干这个事,你的股价就会上涨,整个市值会上涨,你就可以有更多的现金、更多的融资空间。但是 SpaceX 在路演文件里说了,我不干这事。那个意思就是说,我不需要钱,我不惦记再从股市上搞到更多的钱了。

既然不需要更多的钱,实际上也就不需要特斯拉反哺。原因很简单,SpaceX 缺钱,它是亏钱,特斯拉是挣钱的现金奶牛。他都不惦记向股市上去割韭菜了,那更不需要特斯拉的钱了。所以从马斯克前面的这些话来说,他并不特别着急把这两个公司合并起来,甚至他不太想合。

但还有另一个版本

2026 年 5 月 26 日,CNBC 援引知情人士的话说,马斯克已经和他最信任的同事讨论过两家公司合并的问题了。5 月 30 日,《财富》杂志做的报道,合并可能诞生 3.4 万亿美元的公司。这句话什么意思?就是把两家公司市值直接一加,就是 3.4 万亿美金。

一张会议桌上摆着 SpaceX 火箭模型和特斯拉小车模型,桌面中央竖起写着 3.4 万亿美元的合并文件夹,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

第二个就是,他认为 SpaceX 现在泡沫很大。SpaceX 这个股票其实不应该值这么多钱,而特斯拉是实打实在那挣钱的,但是又被明显低估了,因为特斯拉的股价从高点上已经回落了不少。如果用 SpaceX 去兑换特斯拉的这些股票,对于马斯克来说,肯定是特别划算的。

6 月 16 日 SpaceX 公布的招股书里边提到了特斯拉 87 次,提到了马斯克 174 次。人家是创始人,你肯定多提几次,但是特斯拉提到的次数也是非常多的,这个频次本身也是一种信号。

而且 2025 年 11 月份,马斯克在自己的 X 帖子上还写了:

我的公司在朝着融合的方向发展,这在某些方面可能会让人感到意外。

当然这个并不是指 SpaceX 要去合并特斯拉,而是指 SpaceX 合并了 xAI。发了这个帖子之后没过多长时间,就把 xAI 给吃进去了。

那你原来说两家没关系,后边怎么折腾折腾就要合起来呢?差不多 10 年的时间,怎么这弯子就转过来了呢?

2016 年没理由,是当时 SpaceX 不值钱,特斯拉正在烧钱,合并是没有协同性的。10 年后的今天,逻辑已经完全反过来了。SpaceX 的估值已经贵出天际来了,用任何的理性方式都已经没法去解释它为什么这么贵了;而特斯拉反而成为了现金奶牛。在这个时候,两家合并是有好处的。

SpaceX 故事讲得特别好。因为对于美国股市来说,最重要的不是你现在挣多少钱,而是你未来有没有故事。SpaceX 有未来故事,而特斯拉现在有现金,而未来的故事正好不太好讲了,那合并这个事情就顺理成章了。

所以咱们前面问会不会这个问题,答案几乎是板上钉钉的。只要马斯克还在,就一定会去合并,合并只是一个时间问题。

第二个问题:为啥不一开始合并,现在又要合并了呢?

这个其实是一个很有意思的问题。很多大公司都喜欢分散上市,只是这些大公司分散上市了以后,并不喜欢合并。原因很简单,那些公司内部是通过很复杂的组织架构,以及各种有限合伙企业等等这样的协议控制这些公司。它可以让大家觉得这是不同的公司,你不光是可以向不同的人割韭菜,还可以干一件什么事?左手倒右手。都是我的东西,从这个口袋里揣到那个口袋里头,我又多了一笔收入进来。

但是马斯克走不了这条路。马斯克是特斯拉的 CEO,SpaceX 的也是 CEO;Neuralink,他是创始人;The Boring Company,就是那个做隧道的公司,他也是创始人。所有这些东西摆在面前,一眼就看出来都是你,没有别人。所以你最后只能合并,你骗不了别人。所以他跟其他公司确实是有一些差异的。

同一个人物剪影站在四个公司招牌之间,手里同时牵着火箭、电动车、脑机芯片和隧道钻机的线,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

马斯克原来投资 OpenAI 的时候,他也去跟山姆·奥特曼说:

算了,别费劲了,你让我当 CEO,我来给你管吧。

他就是一个控制欲很强的人,所以最后只能合并。

合并有什么好处?

你不合并的话,两套董事会、两套财报、两套审计、两套投资者关系,每年光折腾这些事,大概上千万美金的成本就扔出去了。其他人愿意去维持这么多壳的原因,是你可以去割韭菜,可以左手倒右手。马斯克又没闲心思跟你玩这个事。

另外,上市公司之间的关联交易本身也是很麻烦的。任何两家公司有共同控制人的时候,你去做关联交易,都是需要有更多的成本去进行披露、进行审核,甚至有的时候还要过董事会和股东会,这个非常非常麻烦。

那你说它们俩公司有什么事情是一起干的呢?SpaceX 买了特斯拉 Megapack,6.97 亿美金。什么是 Megapack?就是它那个电池做的储能电站。然后买了 Cybertruck,1.31 亿美金。这个是在 SpaceX 没上市之前干的。

如果 SpaceX 上市了以后,前面那一项还是说得过去的,因为你建算力中心,算力中心都要配这个东西,而美国做这玩意做得最好的就是特斯拉。但是你说你去买 Cybertruck,如果当时 SpaceX 上市了,这事没法弄。你为什么买这玩意?这有问题。当年的瑞幸咖啡就是因为类似这样的事情倒台的。

但是对于上万亿美金的公司来说,这个 1.31 亿不是什么特别大的事。另外大家也给马斯克一个面子,而且他自己内部做的这些账目应该还是比较平的。SpaceX 花真金白银把 Cybertruck 买回来了,而且只要发火箭、发星舰,他就开着 Cybertruck 满街跑,还给 Cybertruck 做个广告。这玩意你说算关联交易吗?打死了都得算。当两边都上市了以后,这个事是很麻烦的。

火箭发射场旁边停着一辆 Cybertruck,远处有 Megapack 储能柜,旁边竖着关联交易警示牌和审计放大镜,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

股价差距也会带来诉讼风险

还有一个问题是什么呢?你同一个人管两家公司,股价差距太大了以后,散户百分之百会起诉你。

像国内其实也有很多这样的故事,比如说有很多房地产公司是上市公司,房地产下面的物业公司也是上市公司。但是物业公司通常很挣钱,房地产公司会亏得一塌糊涂。原因很简单,物业公司是个轻资产公司,他就错在这,给你做点服务,做点什么这些东西就搞定了。而且你还非买它不可,这房地产公司把房子盖了,你就必须要雇他的物业公司,你换不了。

那么下边就有人说:“你这有问题吧?你是不是把房地产公司的利润装到物业公司里头给大家发了?”房地产公司的股东肯定不乐意,这个是很正常的。以后如果特斯拉股价跌了,SpaceX 股价暴涨,那它股东肯定去告他。两边都是马斯克,你是 CEO,你是不是偏心了?

所以这就跟大家解释清楚了,为什么一开始不合并。一开始我要分头割韭菜。为什么现在合并?因为你就是马斯克一人管,控制欲很强,不合并肯定被人告死,所以只能合并了。

第三个问题:到底谁吃谁?

三种玩法到底怎么个玩法呢?首先给大家一个结论,一定是 SpaceX 吃特斯拉,不可能是剩下两种。

原因一:SpaceX 的估值水分更大

SpaceX 现在的估值,现在的股票水分要更大一些,用它去吃特斯拉划算。特斯拉的股价是老老实实用 PE 撑起来的,虽然 PE 也是 200 多倍,但是人家是有利润的,是现金奶牛。而 SpaceX 那是 PS,上百倍的 PS,从来没见过这样的公司上市,这个水分太大了。所以一定是要用有水分的这边去吃另外一边,这是第一个原因。

原因二:SpaceX 代表未来故事

SpaceX 才代表未来的故事,而特斯拉代表的是昨天的故事。你想想汽车这个东西,除了在美国,其他地方其实没有那么好卖。你跟中国车打不过,比内卷这件事情,你真比不过中国汽车,真比不过中国新能源。美国是因为贸易保护,不让中国车去,要不然的话,早把它摁在地上摩擦了。

很多人说这不对,特斯拉的车做得非常好。特斯拉的车确实要比其他所有电车做得都好,但是你想想特斯拉的车是多少年更新一代?六七年,有的 10 年才更新一代。中国车呢?一年更新好几代,这玩意你咋比?

剩下的,比如说电池的业务、储能电站的业务,是挺挣钱的,这玩意一点都不性感。你说你特斯拉能干,比亚迪能不能干?宁德时代能不能干?

再有其他的,比如说机器人的业务,这个也很棒,但是你现在还没证明你到底能不能做出来,什么时候量产,量产出来会有什么新的问题,你不知道。而你做出来了以后,中国人也做。

还有就是它的 self-driving,无人驾驶出租车的业务,这个也是一个很有趣、很挣钱的业务,但是这件事情到目前为止也没有落地,就没有正式地在一个国家里头彻底推开过,这个都需要验证。所以一定要用一个有故事的公司 SpaceX,去吞那个故事比较旧、比较容易被质疑的公司。

一枚写着未来故事的火箭拖着长长估值气球飞向上方,下面一辆写着现金奶牛的电动车旁放着 PE 和 PS 两个对比标尺,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

原因三:马斯克的控制权

当然还不是最重要的。最重要的还有一点,就是马斯克是一个控制欲很强的人。他在 SpaceX 里的投票权有 85.1%,而在特斯拉里的投票权只有 13%。如果特斯拉吞并了 SpaceX,等于他把 SpaceX 投票权也让给那些股东了。如果是反过来,SpaceX 吞并了特斯拉,等于是他拥有了 80% 多的投票权。这一定是马斯克会选择的。

为什么不是中间控股公司?

那这事想明白了,还有一个可能性,就是中间建一个完全独立的财务公司,同时把 SpaceX 跟特斯拉一起吃进去。这条路为什么马斯克不会选呢?原因很简单,你如果选了这条路的话,后边的 Neuralink、The Boring Company 这些公司怎么办呢?你就没法独立融资、独立上市了。

前边 SpaceX 还比较弱小的时候,他可以出来讲,我跟特斯拉没什么关系,因为特斯拉是一个实打实造车的公司,你一个造火箭的公司,我可以说跟它没关系。但如果你中间有一个像 Alphabet 这样的纯财务公司,那你 Neuralink 脑机接口公司,你能说我跟它没关系吗?你不能说。那我拿它的钱不就完了吗?我为什么还要再出去融钱呢?它就会遇到这种融资渠道变窄的问题。

所以一定要用一个马斯克绝对控制的、有未来故事的、估值更高的,或者泡沫更大的,而且是有实体业务的公司去控制、去收购特斯拉。所以这个是唯一解。

第四个问题:合并的时候是几股换几股?

当没有上市的时候,大家会去研究几股换几股的问题。但是如果两个都是上市公司,这个没什么好说的,就是按当时市值 1:1 去兑换就完了。这个相对来说比较简单。

有可能会做一个什么溢价呢?比如说,我现在要去吞并了,我从宣布这一天开始往前一个月,拿这一个月的平均价;或者说我用一个平均价,稍微给一个溢价,稍微乘那么一点零几的溢价,去买特斯拉的股票。这个是可以的。

一架天平左盘放着 SpaceX 股票凭证和火箭模型,右盘放着特斯拉股票凭证和电动车模型,中间标着 1:1 与溢价小标签,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这里就有一个小问题:什么时间干这个活?现在普遍的看法是在 2026 年年底,或者是 2027 年的上半年,这个事情就会发生,不会拖得特别久。因为到那个时候,双方的市值还都差不太多。

在什么样的情况下会失败呢?如果 SpaceX 暴跌,跌得已经爹妈都不认识了,这个事就没法干了。

第五个问题:合并谁会反对?谁可以把这事卡住?

这件事咱们要讲清楚,一共分四层:

  1. 法律上有没有反垄断的问题;
  2. 马斯克乐不乐意;
  3. 董事会乐不乐意;
  4. 股东大会。
四道闸门依次写着反垄断、马斯克、董事会、股东大会,一枚并购文件小车正沿轨道逐关通过,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

因为你做合并这事,肯定是要股东大会开投票的。

第一层:反垄断

从反垄断上来说,普遍认为是不会造成什么问题的。因为这俩公司确实有点八竿子打不着,一个造车、造机器人,另外一个是 AI 和发火箭,它们两个确实没有什么相关性。

大家注意,垄断这个事不是因为你们俩大,然后合并了叫垄断,是你们俩原来在同一个行业里头都是领导地位,一合并以后,这个行业里已经有定价权了,这玩意才叫垄断。所以这个合并的过程应该不会受到反垄断法的调查。

第二层:马斯克本人

第二个,刚才咱们讲了,马斯克是乐意的。

第三层:董事会

董事会能不能同意呢?大家要注意,2024 年特拉华州的法官取消马斯克 2018 年 560 亿美金薪酬包的时候,给出的理由是什么?特斯拉的董事会是由马斯克主导,过程不公平,缺乏独立性。

那你说特斯拉的董事会缺乏独立性,SpaceX 的董事会有没有独立性呢?不可能有,对吧,一定是更没有独立性的一个地方。

而且这两个公司的董事会是有很大交叉的:

  • 伊拉·埃伦普莱斯,DFJ 的合伙人,特斯拉跟 SpaceX 的双料董事。
  • 安东尼奥·格拉西亚斯,Valor Equity Partners 一个基金的创始人,他是特斯拉董事,SpaceX 持股 7.3%。
  • 史蒂夫·朱维森,DFJ 的联合创始人,2016 年离开特斯拉董事会,继续担任 SpaceX 董事。
  • 金布尔·马斯克,马斯克亲弟弟,特斯拉现任董事,曾经担任过 SpaceX 董事。
  • 查尔斯·库曼,特斯拉跟 SpaceX 的材料工程副总裁,一个人拿两份薪水。
两个董事会圆桌部分重叠,几位董事头像用线同时连向火箭公司和电动车公司,旁边有独立性问号印章,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

所以这些董事跟马斯克本来就是千丝万缕的商业绑定,本来应该代表小股东利益的董事,跟马斯克本人都有直接的股权和合伙关系。所以马斯克只要点头,董事会是不可能反对的。

第四层:股东大会

马斯克同意了,董事会也同意了,两个公司合并,股东大会也得同意。但是大家要注意,特斯拉的股东大会是一个很奇葩的股东大会。怎么个奇葩法呢?散户主导。

马斯克特别喜欢散户主导。像 SpaceX 上市的时候,还专门要留出更多的股票让散户去买。他真的是想让散户挣钱吗?把马斯克想得太善良了。散户握有更多的股票、握有更多的投票权是有好处的。当你的创始人是一个世界级大网红的时候,这个事就有好处。

这个事有证明吗?有。2025 年 11 月 6 日,特斯拉在得州奥斯汀召开年度股东大会,马斯克的 1 万亿美元薪酬包,以 76.63% 的赞成率直接通过了。这是特斯拉在 SEC 2025 年 11 月 10 号备案的信息。当时,挪威主权基金,还有一些号称是特斯拉大股东的人,都是扬言我们一定要反对。但是只要散户足够多,你们这些号称的大股东都白给。

所以,作为世界级超级大网红的马斯克,他对于股东会的控制,要比他对于董事会的控制更加严密、更加有力。

那你说这事有没有一些小风险呢?也有。就跟特拉华州那个法官似的,直接说你这个董事会缺乏独立性,咔嚓一下把你摁这了。而且你这么多散户股东,谁买个一股就可以作为原告出来告你。这个风险肯定是无法避免的。

结论:这件事拦不住

最后咱们结个尾。会不会合并?基本上板上钉钉,剧本已经都写好了。分散上市的甜头已经吃完了,一个人管理两家公司管不住了,你必须得把它合起来,否则麻烦太多。

一定是 SpaceX 吃特斯拉,而且一定是在 SpaceX 比较贵的时候去买。反垄断不卡,董事会会跟,散户绝对会同意。除了有人会去起诉他,闹出一点小幺蛾子,即使是闹了,也就是拖慢进程,不会有大的什么变化。所以这个事是拦不住的。

SpaceX 火箭像磁铁一样把特斯拉小车和股票图表吸入同一个公司徽章,旁边只有一只小法槌在延缓进度,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

回到马斯克本人

回到人身上。大家看我节目的时候,是 2026 年 6 月 28 日,老马同志的 55 岁生日。他要在有生之年看到火星 100 万人定居,时间窗口也就是 20 到 30 年了,所以他一定会加快脚步去做这些事情。

我们展望一下未来吧。明年有望看到 SpaceX 的 HLS 和 NASA 的阿特米斯 3 去登月,x 也已经在为火星发射做准备了。机器人方面,弗里蒙特工厂 7 月到 8 月就要准备投产,年产目标是 100 万台。未来几年,就有可能会出现机器人帮咱们倒咖啡的事情了。

脑机接口如果要继续做下去,估计也会走独立上市这条路。2025 年已经完成 3 例植入了,2026 年准备是 20 到 30 例。

人类和机器的边界正在变得模糊,近地轨道可能会随着 Starship、随着星舰的成功变得越来越繁忙。至于马斯克最新开的这个新炮,反物质研究,这个事我觉得您还是先把前面的坑好好填一填吧。

月球基地、火星城市、家用机器人倒咖啡和脑机芯片四个未来场景被同一条星舰航线串联,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

未来十年,我们要看的不是 SpaceX 吞特斯拉,而是人类能不能去月球,火星能不能住下 100 万人,机器人能不能走进我们的生活。这些事比任何市值,任何 PE、PS 都要更重要一些。马斯克这个 55 岁的南非人,正在一条一条地把它们都做出来。

最后,我们再祝老马同志 55 岁生日快乐。

今天的故事讲到这里,感谢大家收听。请帮忙点赞,点小铃铛,参加讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片

Anthropic举报阿里蒸馏Claude,林俊旸走后,新来的人必须证明老板选择自己是正确的!

2026-06-26 08:45:59

封面构图中一台标着 Claude 的大型服务器被许多匿名账号气泡围绕,旁边是阿里云形象的办公楼剪影和一条从开源标志转向闭源锁头的箭头,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

突发,Anthropic 实锤阿里巴巴正在丧心病狂地蒸馏 Claude。

大家好,欢迎收听老范讲故事的 YouTube 频道。

首先给三个数字,咱们稍微细品一下:25,000 个假账号,2,880 万次对话,连续 44 天不分昼夜地去蒸馏。这不是黑产薅羊毛,这是有人在系统地偷一个顶级 AI 的脑子。Anthropic 点名的就是阿里巴巴。

很多人就说,中国人又跑去偷美国 AI 了。这个事不需要讨论,中国人一直在蒸馏他们的 AI,这个事不需要否认。但是今天我们要讲的是另外三件事。

  1. 第一,阿里在偷偷地换赛道,从开源转闭源。
  2. 第二,举报方 Anthropic 自己正在被美国政府摁在地上摩擦,两个最顶尖的大模型被禁用了,他现在也要自救。
  3. 第三,也是最要命的,阿里一转身,全世界最后一根全尺寸开源的顶梁柱就这么塌了。这个才是真正让人唏嘘的地方。

Anthropic 指控阿里大规模蒸馏 Claude

一封写给参议院和白宫的举报信摊在桌面上,旁边堆着 25000 个小账号头像和 2880 万次对话的计数器,Claude 图标位于画面中央被放大镜审视,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

先把这个事情跟大家说一下。既然叫突发,怎么个突法呢?

2026 年 6 月 24 日,彭博社发了一篇文章,说我们看到了,一封信。这封信是 Anthropic 写给美国参议院银行委员会和白宫的,落款大概是 6 月 10 号,在一场 AI 听证会前面发出去的。这不是法庭质证的证据,是一方写给立法者的举报材料,还踩着听证会的点递上去了。这个细节是整件事情的一个关键。

4 月 22 日到 6 月 5 日,也就这 44 天里头,约 25,000 个假账号跟 Claude 对话了 2,880 万次,专挑两样东西去问:

  • 第一个是怎么写代码;
  • 第二个是智能体怎么去推理。

这就是 Claude 真正的看家本领。

今年 2 月份,Anthropic 实际上就已经投诉过一次了。当时是 DeepSeek、月之暗面和 MiniMax 三家,加起来是 24,000 个账号、1,600 万次的问询。而这一次阿里就一家,25,000 个账号、2,880 万次问询,比那三家加起来还多,真的是够狠,要么说丧心病狂呢。

但是这个事就是 Anthropic 说了,阿里这边并没有任何回复,就跟前面 DeepSeek、月之暗面和 MiniMax 是一样,他们是不会回复的。

阿里正在从开源转向闭源

一条时间轴从开源旗帜开始,经过人物离场、密集对话流、闭源模型上架,最后停在锁住的旗舰模型货架前,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

事情理清楚了,真正值得我们担心的是什么?是阿里在换方向。阿里一边换人,一边换方向,一边换赛道。

我们要看这个事情是从哪天开始的呢?是从 4 月 22 日开始的。那 4 月 22 日发生了什么呢?要注意,3 月 4 日半夜,阿里千问的灵魂人物、技术负责人林俊旸,在 X 上发了一句话说:

我要撤退了,离开我热爱的千问。

然后他就离开阿里出去创业去了。

当然他发完了这个以后,还稍微拉扯了一下,阿里内部还跟他稍微讲了讲,说你是不是能够留下来呀?最后不,我一定要走。而且在发这个 X 之前的 4 天,林俊旸还在小红书上挂招聘。说走就走,这事是非常非常反常的。

而且不只是他,同一天,后训练的负责人余博文,在更早一个月,千问 Code 的负责人惠彬原,都离开了阿里。公开的口径是架构拆分跟他的技术信仰冲突。当时圈里最火的标题是:千问开源时代要变了吗?

现在这个事基本上实锤了。林俊旸 3 月份走了,4 月份就开始大面积的蒸馏。到 5 月 19 日,千问 3.7-Max 上线,但是千问 3.7 就不再开源了。原来千问 3.6 是开源的,3.7 就不开源了。

所以基本上就是新来的一拨人,这拨人就是急功近利的一拨人,没有千问的各种品牌包袱,也不需要去维护任何名声,就直接生干了。最简单粗暴的方式就开干,干完了以后直接出闭源作品,就是这样的一个玩法。

咱们把四个日期定在一条时间轴上看一下:

  • 3 月 4 日,开源旗手出走,向闭源掉头;
  • 4 月 22 日,被指控大规模蒸馏开始;
  • 5 月 19 日,闭源模型千问 3.7-Max 上线;
  • 6 月 5 日,蒸馏戛然而止。

林俊旸还在千问高举开源的那几年,那个时候一次都没有报过说千问蒸馏谁的这样的问题。偏偏是在林俊旸走了以后,转向闭源整整 7 周之后才开始。闭源旗舰 5 月 19 号发布,正卡在这场蒸馏,也就是 4 月 22 日至 6 月 5 日的正中间。

一只手疯狂汲取 Claude 的看家本领,另一只手把闭源旗舰直接推上了货架:以后我们就玩闭源了,以后不再玩开源了。

阿里没有回应,证据也没有落实,仍是单方面的说法。但当两条线在日历上扣得这么紧,这真的是巧合吗?换了个人,换了个方向,换了个赛道,那打法会不会也跟着变呢?

原来你自己收集数据,自己去训练;现在别费劲了,人家都已经蒸馏 Claude,都已经做出产品来了。特别是有新人上来的时候,大家注意,新人上来第一件事要干嘛?要证明前面那个人是傻瓜,我才厉害呢。那怎么能够做这个证明?弯道超车。怎么去弯道超车?蒸馏。一定是走这条路。

转进闭源红海,要抢写代码、做智能体这种硬的护城河,就有了抄近路的动机。而蒸馏就是最快的近路。这是阿里第一条线。

Anthropic 自己也在自救

Anthropic 站在国会听证会讲台前,一边模型服务器被红色禁用封条压住,另一边举起写有中国偷我字样的求助牌,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

下一个线是什么?就是 Anthropic 自己。Anthropic 自己也正被摁在地上摩擦呢。

6 月 9 日,Anthropic 高调上线了两款旗舰:Fable 5 和 Mythos 5。三天之后,6 月 12 日,商务部长卢特尼克亲笔信给了 CEO 达里奥·阿莫迪,说全球所有外国人立刻下架这两款模型。这个外国人,即使是在美国也不行,即使在你公司里的雇员也不行。

导火索是什么?导火索是亚马逊的研究员把这两个模型的安全护栏完全给绕过去了。Anthropic 在举报信里头特意警告,被蒸馏的模型往往缺乏安全护栏。结果他自己的旗舰,护栏先被当场捅穿了。到今天还关着呢,关了十来天了。嘴上说过几天恢复,外边押注的大概是 7 月份,Fable 应该能够回来。

一边自己被禁,急着解禁;一边跳出来当受害的国家队,告诉国会、白宫:中国在偷我,你们得保护我,给我松绑,让我赶快往前跑,要不然的话这事就危险了。这一告,是举报,是公关,更是游说。

别忘了钱。Anthropic 是一个估值 9,650 亿美元的公司,马上要去冲 IPO 的。他 6 月 1 号偷偷提交的 IPO 申请,而且他这个 IPO 应该真的是近在眼前了。谷歌现在很多人在往 Anthropic 跑,为什么?就是跟他一块 IPO 的。对于硅谷的公司来说,IPO 就是最大的造富机会。现在这么多谷歌已经很资深的人过去,就是先分股股票,IPO 上市的时候我们挣一笔,就要干这个事。

在这个时候,Anthropic 最怕的其实并不是被人山寨、被人蒸馏。他现在最怕的是,把他的模型摁在地上不让发布的这段时间里头,别人追上。而现在看来的话,追上 Fable、追上 Mythos 本身这件事情并没有那么难,因为 OpenRouter 的 Fusion 以及日本 Sakana AI 的 Fugu,其实已经通过使用多模型编排的方式,可以接近 Fable 5 和 Mythos 5 的能力了。

如果它这个真正最强的模型一直被摁着不让发布的话,那他这个优势就很容易失去了。这里边就有两笔账:一个是地缘账,一个是股价的账。

地缘政治与股价压力

美国和中国两张清单像棋盘一样对峙,阿里标识被夹在黑名单文件和下跌股价曲线之间,旁边有军工企业小图标相互拉黑,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

6 月 8 日,五角大楼 1260H 中国军工企业的清单里头,一口气加了 65 家,阿里就在里边,意味着 6 月底美国国防部不许跟你们做生意了。阿里咽不下去,6 月 23 日反手起诉了美国国防部,要求除名。

而且中国这边也进行了对等反制,把不可靠实体名单上加上了洛克希德·马丁、雷神什么都挂上了,还对 28 家美国军工企业搞两用物资的出口管制。两边互拉黑名单,军火商对军火商,科技巨头对科技巨头,这就是修昔底德陷阱:守成大国和崛起大国的结构性冲突。

正好阿里是在名单里头,8 号进的名单,10 号 Anthropic 就直接把信送上去了。这个事情都是紧锣密鼓跟在一起的。现在彭博社把这个信公开出来以后,阿里的股票马上跌了 3%,跌破了 100 美金。拉长了看,今年以来已经跌了 32%。

阿里做 AI 这件事情,这么长时间给阿里的股价其实没有什么帮助。就像小米一样,小米做了半天 AI,对于它的股价应该也是没有什么帮助的。但是公道地说,华尔街整体还是看多阿里的,更多的标签是强力买入,目标价是 190 美金,也就是短期挨锤,长期有戏。

矛盾就在,越 All in AI,短期就越难看;可掉队,长期故事就没了。

更大的问题:全尺寸开源支柱塌了

一座由 0.6B、7B、14B、32B、72B 等模型积木搭成的开源桥梁正在断裂,普通开发者拿着笔记本电脑站在桥下仰望,远处闭源高墙升起,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

在这里,我们不去研究阿里蒸馏 Anthropic 到底谁对谁错的问题。蒸馏肯定是有问题的,人家有用户协议,你去用人家的产品,你就要遵守用户协议,要不然你可以不用。你既然说我要用 Anthropic 的产品,我也花钱买了 25,000 个账号,也花钱去提了 2,880 万个问题,就说明什么?阿里是知法犯法。我明知道你不让,我非要干,这个肯定是偷,没什么好说的。

但是比偷这件事情更让我们痛苦的是什么呢?就是最后一根全尺寸开源的支柱就塌了。

阿里这一转身到底动了谁的奶酪?我的答案可能很颠覆:动的是全世界开发者赖以生存的开源生态。

你会说不对,大家都开源,不是只有阿里一家开源。Kimi、MiniMax、智谱 GLM、百度的文心、小米 MiMo,全都开源。就算阿里千问 3.7 闭源了,那前面 3.6 还是开源的呢。怎么一说阿里千问闭源,这个生态就塌了呢?

大家要注意一点,其他的这些开源,比如 Kimi、MiniMax、智谱,它都是开源一个巨大的模型权重出来。我开源了以后,你爱怎么用怎么用。但是这个东西普通人是部署不了的,你必须得到云计算的机房里,才能把这种大模型部署上去。

你像 Kimi 大概是 1T 参数,也就是 1 万亿参数;MiniMax 大概是接近 229B 这个参数了;智谱的话应该跟 MiniMax 差不太多;小米应该是 1T 的,都是这么大参数了。对于普通人来说,你开不开源跟我有屁关系?

但你说,我现在要使用开源模型,我现在需要一个从 0.6B 到 1.7B,到 7B,到 14B,到 32B,到 35B,到 72B,一直这么上来的一个模型。我在每一个大小上都需要一个开源模型,然后我要根据我自己的使用需求,在上面去进行微调,再去做后训练,去得到自己的模型。

原来干这个活最早是谁干?Llama 在干,就是 Meta 干。后来 Meta 说我不干了,再出到 Llama 4 的时候,只出一个最大的,其他都不出了。然后 Meta 说我彻底不开源了,我就自己闭源再折腾了。那么最后一个在干这件事情的人就是阿里千问,其他人都不干,只有他干。

所以现在谁想去用这种小模型,只能拿千问的模型去后训练、去微调,其他人都不做了。像前面咱们讲的,日本的 Sakana AI 使用的 Fugu,它里边就是用千问 2.5 的 7B 模型去做的后训练、去做的微调。

现在没人干了。从千问 3.7 以后,就再也没有新的这种全尺寸开源模型出来了。那么开源模型这条路可能就崩菜了。

开源大模型和全尺寸开源小模型不是一回事

画面左右对比,左侧是一台普通笔记本连接手机和嵌入式设备运行小模型,右侧是巨型云机房承载庞大模型权重,中间用分叉路牌标出两条开源赛道,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

开源模型其实是两件事:一个就是开源大模型,一个是全尺寸开源小模型。原来阿里是做全尺寸开源小模型的,Kimi、MiniMax、GLM、DeepSeek 都是做全开源大模型的,这是两条不同的赛道。

你说我要做一些小的项目,比如嵌入式设备,你必须要用开源小模型才能搞定。以后没人做了,这个还是非常非常遗憾的一个事情。

阿里原来的路线,也就是林俊旸的路线,是真正把开源做成普惠的基础设施,从手机到机房整条线都喂饱。全世界就阿里一家干这个活。别人开源只做旗舰展品,阿里开源是做整个货架的。

所以开源生态原来就是阿里唯一的一家上去维护这样的一块地方,维护全套设施的人只有阿里一个。他一转身去圈地搞闭源了,现在开源还在,但是人人都用得起的开源、全尺寸开源就没有了。

表面上吵的是阿里偷没偷 Claude,真正发生的是最后一根全谱系开源的顶梁柱正在叛逃,正在叛逃。

最后三句话

三张便签贴在一块浅色白板上,分别画着天平、围栏里的 API、逐渐熄灭的开源灯泡,白板前站着普通开发者思考未来方向,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

最后扒完了这么多层,给大家压箱底三句话。

  1. 第一,别急着站队。两个剧本可能同时为真:美国借国安清扫赛道,阿里换帅以后悄悄走上了闭源加抄近道的路。举报方也有私心,被告方肯定有问题。
  2. 第二,技术没有国界,商业和政治有。AI 拼到今天,不是谁更聪明,是谁更能把聪明圈进自己的篱笆里,圈进闭源的 API,圈进国家的黑名单,圈进招股书。
  3. 第三,别被偷没偷的口水仗带偏了视线。真正该盯紧的是,当最后一个全尺寸开源的旗手也离场了以后,我们这些买不起上万张显卡的普通人,还玩得动 AI 吗?这盏灯灭不灭,跟你我关系是最大的。

留给大家的两个问题

  1. 第一,阿里该不该转闭源?到底是识时务,还是丢了原来的灵魂?
  2. 第二,连阿里都收手了,你还相信开源 AI 有未来吗?

这两个问题,欢迎大家在评论区跟我去讨论。

好,故事就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加 Discord 讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片

婴幼儿纸尿裤甲酰胺罗生门:孩子体内来源成谜?

2026-06-25 08:46:12

婴幼儿纸尿裤、检测报告、问号和时间线卡片围绕在一起,中央是一只被放大镜观察的纸尿裤,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

最近传得很火的婴幼儿纸尿裤罗生门事件到底是怎么回事?

大家好,欢迎收听老范讲故事的 YouTube 频道

5月12日,深圳一位50多岁的医学博士,在小红书上以“靠谱老王”的账号发帖称,纸尿裤里测出了有毒物质。当时没有多少人理他,甚至有很多人骂他。原因是这位“靠谱老王”是做检测设备的,有人质疑他是在贩卖焦虑,惦记多卖几台自家的检测设备,认为他居心不良。

但在被骂之后的41天,也就是6月22日,四部委——市监总局、工信部、卫健委、疾控局——联合成立调查组,进场调查婴幼儿纸尿裤问题。再往后,就出现了一个特别神奇的“四天五个反转”的罗生门事件。

贯穿所有调查的核心问题是:孩子身体里肯定检测出了有毒物质甲酰胺,但它到底从哪里来,到现在为止谁也说不清楚。

今天是6月24日,调查组还没有最新结论。咱们今天分四层把这个事情掰扯清楚:

  1. 甲酰胺到底是什么;
  2. “四天五次反转”到底是怎么回事;
  3. 为什么有检测机构会说“我现在把钱退给你,你不要说这事是我查出来的”;
  4. 为什么说整个事情基本上无解。

甲酰胺到底是什么?

一个化学分子模型、婴儿纸尿裤和剂量刻度尺并排展示,旁边有半衰期时钟和皮肤吸收箭头,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

首先讲一下甲酰胺到底是啥。客观地说,并没有人说“我因为接触甲酰胺,急速中毒,人就没了”。甲酰胺应该是泡沫材料加热以后可能产生的一种物质。它的半衰期其实很短,3到6个小时,进入体内以后还是可以排出去的,通过皮肤吸收的比例也不是很高,所以损害剂量并没有一个特别统一的标准。

离开剂量谈毒性就是耍流氓。

但是,如果这个东西出现在婴幼儿纸尿裤里,就不一样了。纸尿裤是24小时贴身穿的,而且小孩要穿一两年时间。即使是低剂量累积,也没有一个权威研究机构能够确定它到底会不会对人体产生害处。

标准比较混乱

在国内标准里,化妆品是禁用甲酰胺的,GB15979 等规定中也不允许有甲酰胺。但是在婴幼儿纸尿裤的国标里,没有这一项,也没有规定到底应不应该有这个东西。

国标里有甲酰胺的检测方法,但并没有把它列成强制检测项目。所以,如果厂商说“我这个产品符合国标”,哪怕检测出了甲酰胺,它也依然可能是符合国标的。

在欧盟标准里,甲酰胺是有规定的。它被列为一类生殖伤害物质,也就是欧盟认为它经过动物实验证明对人类是有害的。所以欧盟的婴幼儿标准规定,每公斤不得高于200毫克。法国在2010年就把这个事情定下来了。

但是美国在这件事情上没有标准,日本在这件事情上也没有标准。

所以这就是这个物质的核心争议:它有毒吗?欧洲说这东西有毒,美国没说;中国说它不能放在化妆品里,但是纸尿裤里没有明确规定。

时间线:为什么说这是罗生门?

一条从5月12日延伸到6月23日的弯曲时间线,节点上摆着小红书帖子、报纸报道、品牌声明、录音文件和退款电话图标,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

时间线就比较有意思了。这个故事之所以被称为罗生门,核心就在时间线上。

5月12日:王东鉴在小红书发帖

5月12日,深圳的王博士王东鉴,首先在小红书上发帖。他说,他们公司里有几个宝妈,也就是孩子刚出生的母亲,发现小孩使用纸尿裤以后出现红屁屁的情况,于是拿他们自家的检测仪检测了一下,发现纸尿裤里含有甲酰胺。

随后,他的小红书账号被禁言了。

6月18日:《经济参考报》报道引爆事件

真正把这件事引爆的,其实不是王东鉴,而是6月18日《经济参考报》调查记者王文志发布的一篇报道。报道称,好奇、碧芭宝贝、Babycare 检出了甲酰胺。

这里面有两个硬核信息:

  • 山东省公共卫生临床中心上百份婴幼儿血尿样中,最小的孩子只有17天,检测出了甲酰胺;
  • 记者自己也做了实验,把纸尿裤直接绑在胳膊上,一段时间后,他体内的甲酰胺含量直接翻番。

这是6月18日发生的事情。

第一次反转:品牌和检测机构否认

6月18日到6月19日,三个品牌出来否认,表示:

我们没事,跟我们没关系,我们都是符合国标的。

随后,给记者做检测的山东省公共卫生临床中心也发声明称:

我们从来没进行过这样的研究,这事跟我们没关系,我们没干。

甚至给检测签字的特聘主任也出来签字,称:

这事我没干,不是我干的。

于是很多人开始骂记者,说他为了骗流量瞎编,人家明明没有给他做实验。

行业协会三连质疑

6月19日,中国造纸学会卫生用品专项委员会三连质疑,称企业是合规的,市面上都是安全可控的,并质疑检测是否按照正常流程、是否合法合规。

第二次反转:记者放出录音

6月19日晚上,调查记者王文志放出录音。录音中的于兆衍,就是前面提到的山东省公共卫生临床中心特聘主任。

需要注意的是,特聘主任并不是机构里有编制的人。这意味着:

  • 这个中心对他没有100%的控制权;
  • 这个中心也不会100%保护他。

于兆衍在录音里表示,领导压着他签字,这不是他想签的,上面有压力,一定要逼他这么说。他还说:

用我这条老命把实验保下来,就是数据不能丢。

第三次反转:品牌称送检未检出

6月21日晚上再次反转。三个品牌都表示:

我们没检查出来,我都送检了,我们这里头没有甲酰胺。

但即使它们检测出来了,也没有公信力。这里不仅仅是送检或抽检的问题,还有一个更严重的问题,会导致任何在纸尿裤里进行甲酰胺检测的结果都没有公信力,后面会讲为什么。

王文志发公开信

之后,王文志发公开信,表示自己只为那些体内检出甲酰胺的孩子,其他不管、不关心。

他的核心意思是:厂家到底有没有问题,跟他没关系;但孩子身体里已经有甲酰胺,这东西到底是哪来的?他也质疑这三个品牌方是不是做了一些特供样品去送检。

第五次反转:王东鉴接受专访

6月23日,王东鉴,也就是深圳这位卖检测器的医学博士接受专访。他说:

如果我错了,我去坐牢,没问题。

他还表示,这件事不只是用他们自家的检测设备测了,还找了第三方检测。只是第三方检测机构的法务刚给他打电话,给他退钱了。也就是说,他去检测,对方现在把钱退给他,检测报告作废。

随后,山姆超市把好奇品牌的纸尿裤全线退款,不管拆没拆,都可以拿回来退。其他两个品牌的纸尿裤估计没有进山姆,只有好奇品牌进了。

这就是所谓的四天五反转。为什么称之为罗生门?因为写剧本都不敢这么写,就这么来回翻。

五张写着反转的卡片像多米诺骨牌一样来回倒向不同方向,旁边有品牌、记者、检测机构和消费者四个小人物相互拉扯,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

事件中的关键人物和品牌

三个人物剪影和三个纸尿裤品牌盒子分布在关系网络图上,线条连接点火人、揭盖人、检测主任和品牌方,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

王东鉴:点火人

王东鉴是步锐生物的法人,医学博士,原来是500强医疗销售总监。公司主营医疗呼气检测,自研了名为 SPI-TOFMS 的质谱仪。

他出来爆料后,很多人质疑他是否是在制造焦虑,想卖设备。

王文志:揭盖人

王文志是《经济参考报》调查报道室主任,从业20多年,八次获得中国新闻奖。

他曾参与祁连山非法采矿报道,该报道获得第31届中国新闻奖一等奖,并牵出一位副省长、19位县处级干部。2024年11月,在合新铁路暗访时,他被中铁七局打伤。

要致敬这位硬汉记者。

于兆衍:受夹板气的人

于兆衍是山东省公共卫生临床中心质谱中心的特聘主任。所谓特聘,就是不完全受机构保护、没有编制的人。

关于他,出现了三个版本:

  • 第一个版本:于兆衍给了数据;
  • 第二个版本:于兆衍签字否认,称这事不是他干的;
  • 第三个版本:录音显示,他称自己受到了压力,必须签字,而且要豁出命保住实验。

三个品牌

第一个是好奇,是美国金佰利公司旗下品牌,市占率16%,在中国纸尿裤市场中排名第一。它的产品大部分是自产,但也有一小部分是外包生产。

第二个是碧芭宝贝,属于爱朵集团,在中国的市占率大概是2%,100%完全自产。

第三个是 Babycare,属于杭州白贝壳集团,在中国的市占率大概是8%。它完全没有自己的工厂,100%全代工。但给它代工的是中国纸尿裤代工第一企业,也就是最大的代工企业豪悦护理。

山姆退款退的是好奇。

检测机构为什么会退款?

接下来讲一个有趣的事情:法务退款。检测机构给人做了检测,检测完又把钱退了。

这个事跟《经济参考报》的调查记者王文志无关。王文志找的是山东公共卫生临床检测中心,在山东省各地收集血样、尿样做检测,而且记者自己也做了把纸尿裤绑在胳膊上的实验,绑了一段时间后,数值出现明显变化。

退款发生在王东鉴这条线上。王东鉴自己是卖设备的,所以他知道“我自己说这东西有问题”肯定不行,于是委托了第三方。

这个第三方后来经过一些记者核实,应该是合肥广测产品检测研究所。他们给出的报告也是检测出了甲酰胺。

6月23日早晨,合肥广测的法务给王东鉴打电话,要求退款、报告作废、不担责任,意思是这个事到此为止,检测费还给他。

一份检测报告被法务电话、退款账单和作废印章围住,报告边缘露出甲酰胺检测数值但没有正式盖章,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

王东鉴问对方:报告是否客观反映了送检产品?法务没有否认。因为如果否认,就相当于把检测机构的牌子砸了。

他又问:报告上写的是不是能够证明里面有甲酰胺?法务说是,确实里面有,但是他们不能出具报告,钱退回,报告作废。

王东鉴也表示理解,因为这个事压力肯定很大。合肥广测和步锐,也就是王东鉴的公司,并非完全没有关系,往上隔几层后还是有一定股权关联,但没有直接关联。所以这件事到底是完全公正的检测,还是另有情况,现在也没法说,还是等国家给报告。

王东鉴对甲酰胺来源的猜测

王东鉴自己对这件事情的猜测是,他把纸尿裤整个拆开,一块一块去检测,也测出了到底是哪一块有问题。

他说,他们测出来有问题的东西,实际上是里面的一些胶,特别是类似橡皮筋的东西。因为纸尿裤要绑在身上,需要有一部分是有弹性的。

他表示,如果用食品级的胶,大概是1万二到1万八一吨,价格很贵;如果用回收的 EVA 改性胶,就是几千块钱,差3到5倍的价钱。

被拆解成表层、吸收芯、弹性胶条和底膜的纸尿裤剖面图,旁边用价格天平对比食品级胶和回收EVA改性胶,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

现在这个市场已经是红海,而且以后小孩越来越少,大家都不生了,做纸尿裤的人也要降本增效。

但有一点必须注意:到目前为止,甲酰胺长期接触人体,特别是长期接触婴幼儿人体一两年之后,到底会对人产生什么伤害,其实并没有一个特别明确的确认。这一点还是要讲清楚。

为什么检测结果都没有公信力?

为什么所有人去测甲酰胺都没有公信力?这是中国一个更神奇的规定。

在中国,要想让检测报告有公信力,上面要盖两个章:一个叫 CNAS,一个叫 CMA。

但是中国规定,如果国标里没有这一项,你去检测了,就不给你盖这个章。只要国标里没有甲酰胺这一项,不管检测结果是有还是没有,这两个章都不给盖。

两枚写着CNAS和CMA的印章悬在检测报告上方却无法落下,旁边有一本国标目录缺少甲酰胺项目的空白栏,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

所以不管是送检、抽检还是全检,只要检测的是这一项,就没有公信力。这是中国管理国家标准的一个很奇葩的规定。

因此,记者最后也咬死了一件事:不管这东西是怎么来的,只关心孩子身体里已经检测出了甲酰胺。哪怕不是纸尿裤来的,也要搞清楚孩子身体里的甲酰胺到底是怎么来的。

行业协会与“维护颜面”

在这个事件中,行业协会从来没有想着怎样维护行业的整体高水平,怎样把害群之马干掉。他们想的永远是如何维护行业的颜面。

所以一出事,他们没有做调查研究,而是直接上来开骂。这也是很让人讨厌的一点。

有没有可能厂家也是冤枉的?

有没有可能厂家也是冤枉的?老范一般不会逮着一头锤。有没有可能大家都是对的:记者也是对的,深圳这位博士也是对的,厂家也被冤枉了?

很多人会说,怎么可能,总有坏人。对,是总有坏人。但这里还有一个特别神奇的案例。

2025年315晚会的梁山希希案

2025年315晚会上有一个案例,叫梁山希希案。

山东梁山有一家叫希希纸业的公司,做了一件特别奇葩的事情:他们跑到山东附近这些做纸尿裤、卫生巾的厂商那里,把人家的残次品收购回来。收购回来以后,重新敲打蓬松、装包,然后贴上名牌再销售出去,谋取30倍暴利,涉及很多品牌,其中就包括 Babycare。

这个案子叫翻新黑产案。

一条灰色地下回收链路把残次纸尿裤从工厂废品箱运到翻新包装台,再变成贴着名牌的商品流向货架,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

需要注意的是,Babycare 虽然所有产品都是代工的,但它找的也是大号、靠谱的代工厂。可是,如果生产过程中有残次品,这些东西应该销毁还是怎么处理?销毁也有成本。有人说“你给我吧,我帮你处理掉”,梁山希希就是这样的公司。

它重新包装以后,仍然叫 Babycare,但并不是 Babycare 真正授权的合规代工商,卖的是假货。

所以现在你在超市里买到的纸尿裤、卫生巾或者纸质用品,未必是从原厂出来的,也未必是由原厂认证、签协议的代工厂造出来,再经过原厂抽检或检测后的合格产品。

因此,两边都有可能是冤枉的,这种可能性是存在的。

为什么说这件事基本无解?

消费者站在迷宫入口,迷宫墙上分别写着国标、检测、代工、黑产、行业协会和舆论信任,出口处是一个巨大的问号,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

这导致一个问题:我们现在根本不知道该信谁,这个事情变得无解。

甚至现在国内很多社交媒体会传播一些特别弱智的内容,比如:

农民洗菜居然敢用一种叫一氧化二氢的东西去洗菜,这个东西是化学的,多危险呀。

大家知道一氧化二氢是什么吗?那不就是水吗?但就是有人信,信完以后就开始骂:怎么可以放一氧化二氢?如果孩子长期吃了怎么办?

除了“一氧化二氢”,还有一种很奇葩的东西叫“脱碳甲醛”。甲醛大家都知道对身体有害,房子里有甲醛可能会得白血病。但脱碳甲醛是什么?脱碳甲醛其实还是水。把甲醛分子式里的碳去掉,剩下的还是 H2O,还是水。

还有人玩得更花。该放盐的时候,他说“我们这放的不叫盐,我们这放的叫氯化钠”。很多人就会说,怎么可以放氯化钠,怎么可以放化学的东西?其实盐就是氯化钠,学过初中化学的人都知道。

但没办法,现在你说有人往菜里放氯化钠,还是有人会跳起来。

塔西佗陷阱

中国为什么会出现这么奇葩的事情?有一个词叫塔西佗陷阱。

塔西佗是古罗马的一位史学家,他曾经有一句名言:

一旦皇帝成了被憎恨的对象,他做的好事和坏事就同样会引起人们的厌恶。

现在等于我们什么事都不信,什么事都讨厌。有人说不可以放一氧化二氢,有人说不可以放脱碳甲醛,有人说饭馆做菜不可以放氯化钠,这实际上都是塔西佗陷阱。

到底谁可信,谁不可信?卖检测器的人敢去检测别人的纸尿裤,就一定是坏人。实际上,这都是塔西佗陷阱在起作用的结果。

这不是某个厂子黑心那么简单

所以今天讲的,不是某个厂子黑心那么简单,而是几件事情叠加在一起:

  1. 国标不完整;
  2. 中国检测制度很奇葩,只要国标里没规定的,任何检测结果不允许盖章;
  3. 检测机构一旦遇到压力就马上翻供,比如山东那边遇到压力后马上翻供;合肥这边遇到压力后马上退款,检测报告作废;
  4. 厂家所有产品都是抽检,没有任何公信力;
  5. 存在大量代工,有的品牌只是品牌运营,所有东西都不是自己造;
  6. 存在翻新黑产,哪怕是真的品牌,也未必是经过正规流程出来的东西;
  7. 各种行业协会只会捂盖子、维护声誉,不会去做抓坏人的事情。

所以整个体系基本上是无解的。

最该回答的问题被绕开了

其实讲到最后,最该回答的问题都被绕开了。

什么才是最该回答的问题?现在小孩身体里有甲酰胺,这个东西哪来的?

哪怕说它不是纸尿裤里来的,或者说这些孩子买的纸尿裤是假的,这也没问题。但是现在这个东西已经在孩子身上出现了,就必须找出出处。这才是真正现在要做的事情。

致敬调查记者

最后,还是要致敬一下。

一地鸡毛里,只有一个人咬死了一句话,就是王文志。他说:

我不关心纸尿裤怎么来的,我只关心孩子身体里的甲酰胺是怎么来的。

中国非常需要调查记者。如果这批人都被收拾干净了,我们吃的、穿的、用的就更没有保障。

虽然现在这个状态,我也不知道未来会怎么改善,但至少像王文志这样的人还在努力折腾,还在努力调查,我觉得还是要向他们致敬。

一个社会愿不愿意保护多管闲事的人,决定了普通人能不能买得安心。这次医生没有闭嘴,记者没有缩头,就冲这一点,这件事情还是值得我们继续关注下去。

好,这个故事今天就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加 Discord 讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。


背景图片

Sakana AI跑分超越Mythos,但日本AI依然无法与中美竞争!

2026-06-24 08:53:11

东京办公楼窗前一条橡皮泥河豚悬在跑分榜单上方,旁边是美国和中国 AI 巨头的模糊标牌,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

日本在 AI 领域里终于追上来了?终于不是中美两国的游戏了?Sakana AI,也就是“鱼 AI”,超越 Mythos 了?

昨天,6 月 22 日,日本一家叫 Sakana AI 的公司发布了一个东西。Sakana 在日语里是“鱼”的意思,它发布的这个东西叫 Fugu,日语里应该就是“河豚”。一上来,它就放了一张跑分图:在 SWE-bench Pro 编程榜上,它最高档拿到了 73.7 分,把 Anthropic 的 Claude Opus 4.8 的 69.2 分,以及 OpenAI 的 GPT-5.5 的 58.6 分,全都压在身下了。

它甚至宣称,连 Anthropic 两个最强的 Mythos 和 Fable,它都已经部分超越了,也就是有些分数比它们还高。于是网上一片欢呼,说日本终于在 AI 领域里赶上来了,不再是中美两国在这玩耍了。

先把结论放在这:别急着高兴。这事看起来像追上来了,扒开一层看看,根本不是那么回事。

Sakana 这条鱼到底是真追上来了,还是又一次聪明的投机取巧?咱们就把这条鱼从头到尾拆开来看一看。

这里要补充一句:Mythos 和 Fable 是 Sakana 自己宣布的口径,没有独立的第三方评测。原因也很简单,这两个模型现在禁用了,只要不是美国公民就用不了,所以他们也没有办法拿出评测数据来。

Sakana AI 到底是什么公司

三条橡皮泥小鱼从东京地图上游出,分别连接聊天、报告和编排系统三个小图标,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

首先把表面一层打开看看,这条鱼到底长什么样。Sakana 并不是一个突然冒出来的草台班子,它有来头,有产品,有跑分,表面上看起来确实比较唬人。

这家公司在东京创建,2023 年成立。它一直主打的不是从零打造大模型,这句话大家要仔细听:它没有从零打造大模型,而是把现成的模型重新组合、编排一下。

三条产品线

它的产品线上一共有三条鱼:

  • 第一条鱼叫“鲶鱼”,3 月 24 日发布的日语大模型,搭配了一个免费的 Sakana Chat。
  • 中间发布的一条叫“枪鱼”,6 月 15 日发布,自主研发的 agent,能在不用盯着的情况下自己跑 8 小时,产出 60 到 100 页的战略报告,应该是瞄准 Manus 那样的产品去的。
  • 最新的,也就是 6 月 22 日发布的“河豚”,其实是一个多模型的编排系统。

三位创始人

它一共有三位创始人。

CEO 叫 David Ha,名字是 David,后边是 Ha。按照广东拼音来说,这个人应该姓夏,应该是一位华裔。虽然他在日本创业,但他出生在香港,年幼时随父母去了加拿大,多伦多大学本科,东京大学博士,曾在谷歌大脑做神经网络和进化算法,还当过 Stability AI 的研究负责人。

第二位是 CTO,叫里昂·琼斯,英国人,伯明翰大学出身,是 Transformer 那篇论文 Attention Is All You Need 的八个作者之一,是真大神。他在谷歌干了 12 年,在这个团队里真正管技术和方向的人,就是这位大神。

还有一个人叫伊藤,是这家公司的 COO。东京大学法学,纽约大学法学院,带过日本独角兽的全球化市场。更关键的是,这哥们出身于日本外务省,有外交和政府背景。

所以,这家公司是一个华人创始人,一个写了 Transformer 论文的英国人管技术,一个有日本政府背景的伊藤在管关系。真正的日本本土、又偏官方的,其实是伊藤。这个细节非常重要。

“河豚”不是一个模型,而是一个系统

一只橡皮泥河豚站在圆形工作流中央,周围多个模型方块按箭头循环传递任务、执行和检查,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

下一个问题:这一次跑赢了 Anthropic 大模型的这个“河豚”到底是什么?

它不是一个模型,它是一个系统。所谓超越 Mythos,超越的方法很关键。河豚自己没有前沿大模型,它是个编排器,把别人家的模型拼出来一个高分。大家觉得日本行了,其实不是这么回事。

为什么我会管河豚叫系统,而不叫模型?因为它的核心是一套 AI 工作流编排系统。现在有一个新词叫 Loop Agent,循环智能体。

过去我们干活都是过程管理,或者叫顺序执行:先干什么,后干什么,从哪进去,从哪出来。画过流程图的人都知道,流程图里有一个开始节点,有一个结束节点,我们在这两个节点之间画整个流程。

而 Loop Agent 干的活是什么?它是转着圈干。它有输入,有要求,然后有很多大模型在里边承担不同的角色。有人负责拆解任务,有人负责执行,有人负责检查结果。如果检查不满意,那就再转一圈,一直转到满意为止。这就是现在比较流行的一种新的 AI agent 工作方式。河豚恰恰是这样的一套系统。

关键在于它没有公开底层模型

河豚最鸡贼、也是最关键的一点是什么?它不告诉你里头到底放了哪些模型,但是它保证里头没有放 Fable 5 和 Mythos 5,因为它需要跟 Fable 5 和 Mythos 5 竞争。而且按照现在美国商务部的要求,它也不能用 Fable 5 和 Mythos 5。

但是,你说这里头有没有 GPT-5.5?有没有 Gemini 3?有没有 DeepSeek?有没有 Claude Opus 4.8?这个它不说。它只说,我们跑分跑得比 Claude Opus 4.8 还高一些。

所以它大概率是怎么干活的?比如说一个任务进来,Opus 4.8 负责拆解;拆解完以后,GPT-5.5 去执行;一些不是特别关键的任务,可能就扔给 DeepSeek 去执行;执行完以后,可能又扔回给 Claude Opus 4.8,让它检查一下有没有问题。有问题的话,再转一圈,一直转到“我觉得可以了”,再把东西吐出来。

在这样的情况下,它跑分比 Claude Opus 4.8 高,比 GPT-5.5 高,甚至在个别指标上可以超越 Fable 5 和 Mythos 5。它就是这样一套系统。

它有没有自己的模型

那河豚里头到底有没有自己家的模型?还是有的。不是前面那个鲶鱼模型,鲶鱼模型实际上是在 DeepSeek V3.1 的一个版本上做后训练出来的,也不是从头做的,待会再讲那个模型。

河豚系统里有一个叫“指挥模型”的东西,一上来可以稍微指挥调度一下。这个模型是用 Qwen 2.5 7B 做的后训练。每一次任务进来,拆解可能还是要用大模型去拆解,但它负责在里边进行循环调度。所以你说它完全没有自己的模型,这也不对。

鲶鱼模型的价值:本土化,而不是前沿底座

橡皮泥鲶鱼在日文资料卡和历史问题卡片之间重新标注答案,远处有 DeepSeek 底座方块作为基础层,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

再转过来说鲶鱼模型。鲶鱼模型是基于 DeepSeek V3.1 Terminus 做的后训练。除了 DeepSeek V3.1 Terminus 之外,它也参考了 Llama 3.1 405B 的一个开源底座,然后自己训练出模型。

别看咱们现在嘲笑它拿别人的模型去后训练,大部分人连这一步都做不到。能够在人家的基础上做后训练,训练完以后还有更好的效果,不是一般人能搞定的。

有一个非常有意思的细节:DeepSeek 原版对于日本政治历史敏感问题会拒绝回答,72% 的问题都会拒绝。中国人训练的模型,你去问它“抗日战争怎么回事”,很多内容它是答不上来的。而 Sakana 用自己的日语数据后训练之后,拒答率几乎降到了零。

这说明它的价值是本土化适配,而不是造更强的脑子。它没有触及最硬的东西,也就是自己的前沿底层模型。

没有底层模型,就没有护城河

橡皮泥小鱼公司站在没有城墙的浅色平台上,远处三座大厂模型城堡握着 API 钥匙和价格标签,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

下一个问题大家就要问了:没有前沿底层模型,人家不也跑得好好的吗?你怎么就说日本人不行呢?

今天要讲的是,没有底层模型就没有护城河。编排这件事本身是没有门槛的,谁都能做,而且你的命门是拿捏在别人手里的。

OpenRouter Fusion 的对照

这条路不光 Sakana 这一家“鱼公司”在走。全球最大的模型聚合平台 OpenRouter,6 月 12 日就上线了一个几乎一模一样的东西,叫 Fusion。它可以把最多 8 个模型编排在一起,跑同一个问题,再让一个裁判模型把大家的答案融合成一个,号称不用 Fable 5 就能够逼近 Fable 5 的质量,成本只有 Fable 5 的一半。

它的角色分工和河豚是一个思路:干活的和检查的分开,而且干活的不允许自己检查,避免自己给自己打高分。OpenRouter 自己说了,约 75% 的提升来自裁判的融合,只有 25% 来自模型的多样性。

用这个对照就能说明,多模型编排是一个公开的、谁都能拼的工程手段,不是 Sakana 的独门秘技。一个东西如果连聚合平台都能顺手做一个,它就不构成护城河。

真正的护城河是底座和价格

那么到底什么是护城河?底座和价格才是护城河。底座模型是我自己的,我可以有底座模型价格的定价权,这才叫护城河。

而现在这些东西都在谁手里?都在 AI 大厂手里:OpenAI、Anthropic、谷歌,都在他们手里。而且这些做编排系统的公司只能用大厂已经公开发布的模型,可是大厂经常会捂着一两代模型,甚至有很多模型从来就不发布。这些大厂自己最清楚什么时候发新产品,几款产品之间到底差在什么地方。

等这些做编排系统的公司,也就是像 Sakana 这样的公司,拿到大厂最新的模型,开始研究怎么编排、怎么优化的时候,人家大厂内部的编排系统、Loop Agent 系统,早就已经迭代了不知道多少回了。所以你想跟他们比,根本就比不了。

而且价格也不是 Sakana 这样的公司能够控制的。你编排了半天,最后还得老老实实给 Anthropic 付 token 的钱去。而且 Anthropic 没准哪天一开心,还给你把账号封了。Anthropic 干这种事太正常不过了,OpenAI 也是这样的。

你说我用了 GPT-5.5 作为底层模型,上头给你编排了一下。那你干完活以后,得给 OpenAI 交钱。那我把账算好了,最后把自己该挣的钱挣到,不就完事了吗?

这里就有一个新的问题:大厂 AI token 的价格是不透明的。它可以把 token 价格搞得很贵,把自己的套餐,比如 20 美金的 Plus 套餐,价格搞得很便宜;或者说虽然是 20 美金,但是给你的量很大,导致套餐里的 token 很便宜,而外边的 token 很贵。

大厂做这样的动作以后,花钱买 token 的像 Sakana 那样的公司,不一下就没了吗?你的利润空间完全在人家的报表上,什么时候想弄死你,什么时候就弄死你。所以这是完完全全没有护城河的。没有自己的底层模型,也没有模型的定价权,这就是 Sakana 这类公司的尴尬之处。

编排公司吃的是窗口期

编排这套手法本身就不保密。OpenRouter 能上 Fusion,大厂自己当然也都把编排内置到自己的产品里去了。前面我们还专门录了一期视频分析 Fable 5 被人破解出来的 12 万字系统提示词,实际上就是一套这样的 Loop Agent 系统在运作。

而且大厂随时可以决定哪天去摁按钮。按完按钮以后,没准把你的 API 接口封了,或者把价格调整一下,把 token 价格涨一涨,把套餐里的用量涨一涨,那你们这些做编排的公司,不一下就被人挤死了吗?

所以这种纯编排公司,本质上吃的是一个结构性的窗口期。窗口开着的时候,你有饭吃;窗口一关,你连桌子都上不了。

而且这个事你自己完全没有任何主动权,所有权力都在大厂手里,人家随时想给你关,就随时给你关上。

互联网广告平台的历史类比

橡皮泥小广告平台排队接入巨大的谷歌流量水龙头,水龙头旁有价格旋钮和收购标签,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

当年谷歌就是这么把一堆小广告平台干掉的。核心的价格和流量在谷歌手里,你在某个环节优化得再漂亮,也架不住人家从源头上直接弄死你。

讲到这,稍微把过去这段历史跟今天的 Sakana 对比一下。把时间拉回到互联网刚开始的时候,那时候所有人都想明白了一件事:广告就是唯一的出路。大家都去做广告吧。

于是有一大批公司跑出来,在广告各个细节、各个环节进行优化,比如投放优化、竞价优化、归因优化、广告网络之间的交换怎么优化、怎么进行计件,做了好多这样的系统出来。

你说这种系统技术有价值吗?有,而且很多人的技术还是很扎实的。结果这些公司今天都哪去了?这些公司都死了,或者被大厂收购了。现在一提互联网广告公司,就是谷歌、Meta、苹果、X;中国的就是腾讯、字节跳动,其他没了。那些小公司都被他们干掉了。

原因很简单,这些大平台自己是有流量的,它可以随时决定涨价降价。你那些小公司优化了半天,最后还是要用它的流量,那只能被它干掉。

像我以前在猎豹移动,我们也做广告,但是必须要接谷歌和 Meta 的 API,要在那边把流量跑出来。那它随时就可以弄死我,就是这么简单的情况。

这些广告公司里,绝大部分是雨打风吹去就没了,极个别做得特别好的会被收购,大厂重新把它买回来就完事了。而且买进去以后,其实也不是要它们的技术,而是要它们的用户、要它们的流量。这就是当年的历史,跟今天的 Sakana AI 非常非常像。

Sakana AI 的可能结局

橡皮泥 Sakana 团队坐在日本地图形状的谈判桌旁,桌对面是谷歌、OpenAI 和 Anthropic 的收购文件夹,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

那你说日本这一次是不是又完蛋了?Sakana AI 耍了一把小聪明,骗了人的钱,最后做不出来东西,还让大家跟着白开心了半天?也不能这么讲。

Sakana AI 死不了。它最终有可能成为什么?可能会被谷歌日本收购,或者被 OpenAI、Anthropic 日本直接收购,这个可能性是很大的。实在不行,字节跳动没准还来收你。

正是因为没有护城河,被收购反而是 Sakana AI 最好的结局。它这个团队里坐着一位 Transformer 论文的作者,光这一块招牌,被日本 OpenAI 或者日本谷歌收购的底层逻辑就算通了,定价也不会低。

买家真正买的三样东西

买它的人买的是三样东西:

  1. 第一个是顶尖团队,这看着没毛病。
  2. 第二个是已经铺好的日本本土落地渠道。这里头有一个日本外务省的前官员坐在里头做 COO,这故事讲得通。不需要讲你具体干了什么,把伊藤的简历往这一放,这故事不就明白了吗?而且你说它的政企关系,或者日本大企业买单,这也没毛病。
  3. 第三,它有调 DeepSeek 的历史。它可以把 DeepSeek 这种拒绝回答日本历史敏感问题的模型,调到可以回答日本历史问题。这不,能力已经摆在这了。

这三样东西恰恰是从外边砸钱也比较难买到的。

做纯编排的公司,顶尖的结局就是被收购。这恰恰说明它是有价值的。Sakana 真正的护城河根本就不在技术上。即使它被谷歌收购了,谷歌会用它的编排系统吗?不会。谷歌要的是你的政府关系、你的整个团队、你懂日本,要的就是这东西。

日本本土冠军的逻辑

而且日本有一个特别奇葩的地方,就是它对于本土产业保护得非常好。

以前我们的一个合作伙伴叫 JVC,日本胜利公司。这公司哪来的?美国电气公司在 1920 年代在日本建的分公司,后来打仗的时候分离了,叫 JVC,一直发展得非常好,500 强有时候在前边,有时候在后边,现在这几年不知道了。

还有一个案例是日本雅虎。雅虎在全球基本上都废了,但是日本雅虎依然是日本最大的门户网站。虽然日本雅虎现在跟 LINE 合并了,母公司叫 LY Corporation,但是它还是以日本雅虎的底子出来的。

所以,如果谷歌、OpenAI、Anthropic,也许是字节跳动,把 Sakana AI 直接买下来,就让它好好做日本这个生意,把所有关系打透。剩下技术的事情它就别问了,大厂有的是人给它搞定。这可能就是它未来的一个出路。

Sakana AI 未来不是要去跟 OpenAI、Anthropic、谷歌这些大厂竞争,它抢的生态位叫“日本第一”。这也不是日本追上来了,而是日本又长出了一个只在日本有用的本土冠军。

给创业者、普通用户和投资者的启示

三个橡皮泥角色分别代表创业者、普通用户和投资者,站在底座模型、定价权和透明度三块路标前做选择,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

今天这个故事对于普通人、创业者、投资人有什么启示?

给创业者

首先跟创业者讲清楚,不要在自己没有底层模型的情况下做纯编排系统,做 Loop Agent,也不要把这个东西当成主业去赌。这条路的天花板只有两个结局:做得好,能够被大厂收购;做得差,就什么都不剩,最后会被价格战清洗掉。

你要么手里有自己的模型、独家的数据、流量入口;要么就像 Sakana 一样,去卡一个本地市场或者政企关系,一个不可替代的位置。只优化中间环节,说我技术做得特别好,但命门握在别人手里,长期一定是个死。

给普通用户

第二,对于普通用户来说,能够使用原厂的,尽量使用原厂的,不要去使用这种第三方的编排系统。它们在技术逻辑上有不可克服的先天缺陷,因为它们只能拿别人已经公开发布的模型再去进行优化,这肯定是有问题的。

而且像 Sakana AI 这样,它不告诉你后台是怎么运作的,不告诉你底层用了哪些模型,你就没有办法相信它的结果。跑了半天,这个结果自己看着好像还行,但你要想清楚一点:AI 的运作速度是非常非常高的,它可以一分钟出一大堆结果出来,人的鉴别能力在这个面前是非常苍白无力的。

所以我们现在控制结果的最好方法是什么?就是底层可知,底层有保障。Sakana AI 这些东西是给不了的。

给投资者和内容创作者

对于投资者和内容创作者来说,看一家 AI 公司,先问两件事情:

  • 底座模型在不在自己手里?
  • 定价权在不在自己手里?

编排层公司的估值,要按照被收购的可能性和被收购的预期来算,不能按照下一个 OpenAI 来算。把跑分超过谁当成卖点,尤其要警惕:跑分是借来的,护城河才是自己的,这个一定要记住。

结论:一条日本鱼缸里的锦鲤

一条昂贵的橡皮泥锦鲤在透明日本地图形鱼缸里游动,鱼缸外是开阔大海和远处 AI 巨轮,浅色背景的商业评论版橡皮泥平面信息图的统一风格。

最后给出结论。表面上,这是“日本终于在 AI 开始追赶中美了”的一个叙事;实际上,这是一家没有自己底层模型的编排公司,在重演互联网广告小平台的老路。技术很聪明,商业没有护城河,命门全在别人手里。

更长期来看,今天这条鱼公司,也就是 Sakana AI,最大概率不会变成大海里的鲨鱼,而是会变成日本自家鱼缸里那条最贵的锦鲤。好看,值钱,被别人买走,但是它始终游不出那个缸。

对于整个 AI 大潮来说,它只是一个小小的水花,不会给整个行业带来任何变化。


背景图片