2025-05-07 21:16:35
“没有坏的,就没有好的。”
腾讯新闻科技主笔|张小珺
编辑|马龙
距离上次《独家与李想的三小时访谈》发布过去了130多天,人工智能的世界翻天覆地,我与理想CEO李想决定,再坐下来聊聊对人工智能的全新观察。
这次访谈的话题包括:过去五个月的AI王国变幻、中国AI出现的最大变量DeepSeek与梁文锋、理想还做基座模型吗、辅助驾驶的新模型VLA(视觉语言行动模型)以及李想对AI与人性的哲思。
在AI面前,什么是值得被保留的人性?李想说:“所有的人性都应该得以保留。无论是好的和坏的。”
在他看来:“没有坏的,就没有好的。你可以把好的东西和不好的东西都当成一种特质——它是文化的特质,它是生命的特质,它是性格的特质,它是能力的特质——这样才是一个有生命力的世界,才是活生生的人。”
“当人工智能变成生产工具,
才是真正人工智能爆发的时刻”
张小珺:距离上次AI Talk 过去 130 天,你最大进步是什么?你有成为一个更智能的李想吗?
李想:这 130 天我更高兴看到整个中国进步。包括DeepSeek、通义千问。可以让中国无论是基座模型,还是推理模型、多模态,已经跟美国的距离基本上拉近,或者基本上在一个水平线。
中国的企业做出来这些模型效率也更高,无论在训练的层面,还是在后边整个推理层面,我们做了很多深层工程改造。也让中国人工智能领域更有信心。也包含后边我看到一些比较惊喜的,在 Agent(智能体)上面的突破,无论是 Manus 还是Genspark,非常惊喜。
从我们个人而言,这也树立了我们把 AI 做得更好的信心。
今天大家在讲语言模型,但我还是认为语言模型只是世界的重要组成部分,并不是全部。我们要想理解物理世界,要想让一个终端或者一个机器人能在物理世界和数字世界运行,要做的工作还非常多。这让我们也更加坚信,这条路走下去是对的。
张小珺:那你有变成一个更智能的李想吗?
李想:没有那么大变化。如果从实际角度,人工智能发展这么好,我每天工作时间并没有减少,还是在增加。
张小珺:是啊,这是为什么?
李想:我见到的几乎所有人,还是在把它当成一个信息工具使用。
AI作为一个信息工具不是完美的,因为它最后一定要给你next token(下个词元),一定要给你一个结果。
大家今天使用的时候会先点上联网搜索,先去通过Rag(检索增强生成)联网搜索一些索引信息。但往往索引的信息源,已经失真和不准确了,所以最后推理的过程,(虽然)很认真在做推理,但你明显看到这个过程和结果已经开始有问题。所以如果我们不对这套机制进行一个改造,它仍然在做熵增,在增加大量无效信息、无效结果、无效结论。
这是一个很大挑战,我就在思考一个问题,还是要站在真正用户价值的角度。如果大家在拼命使用AI,大家在为AI做投资,但我的工作时长并没有减少,我的工作结果也没有变好,这个问题到底在哪里?——这也是过去几个月我跟很多人在聊,在思考,我们内部在讨论非常多的一个问题。
很多时候不要把东西缠绕到一起。我们可以先做一个分类,因为人类历史上也会有类似这些的分类:
今天,通过一个对话的方式,无论文本多么长,它都是信息工具,信息工具对大家更重要的是参考作用。
再往下,AI 变好了以后,它会变成辅助工具。我们今天做的辅助驾驶,大家在车上用人工智能的语音方式进行导航,来查找美团、调取音乐,会让效率更高,但它仍然离不开我们。这种角色比较像什么呢?它比原来的使用体验会更好了,但它是辅助工具。
什么时候才能真正改变我们的工作成果以及减少工作时长,它必须变成生产工具。我自己认为Agent(智能体)最重要的评判条件是,它是否是生产工具、它是否真正能替代我完成专业工作、它是否在产生有效的生产力、它是否真的解决我工作中最重要的 8 小时?
这是我接下来对Agent(智能体)最重要的衡量,也是Agent(智能体)的意义所在。
张小珺:这是你对于工具的三个分级:信息工具、辅助工具和生产工具。
李想:人工智能变成生产工具,才是真正人工智能爆发的时刻。
张小珺:总结来说,过去130天最大的变化是外部环境。
李想:对,国际环境在发生重大的变化,技术也在发生变化,但技术最大变化还是中国在人工智能方面带来的变化。美国的变化反而没那么大。
“我和梁文锋聊过一次,
开源星环OS纯粹为了感谢DeepSeek”
张小珺:你从DeepSeek身上学到了什么?
李想:DeepSeek我能学到最好的一个方式是:DeepSeek运用了人类的最佳实践,它极简地运用了人的最佳实践。
它在做DeepSeek V3的时候,V3 是一个MoE(混合专家模型),671B的一个模型。MoE(混合专家模型)是非常好的架构。它相当于把一堆专家组合在一起,每个是一个专家能力。
这个专家能力是怎么构建的?挺明显的,当我们想去构建能力的时候,DeepSeek给你展示一个最佳实践——第一步要先搞研究,这非常重要;任何时候,当我们想去改变能力和提升能力,第一步一定是搞研究,搞完研究以后才搞研发;搞完研发以后,第三步是把能力表达出来;第四步是能力变成业务的价值。
这四个步骤是极简的人类最佳实践,但我们经常做着就忘掉,看到什么东西就直接启动研发,而没有搞研究。我们自己也很受益,无论我们是在端到端和VLM(视觉语言模型)上,还是今天做VLA(视觉语言行动模型),我们的研究团队表现得非常好。
包括你可以看国外的像李飞飞,她在引用辅助驾驶的时候,经常会引用我们关于辅助驾驶方面的研究论文。这个挺重要。
研究跑通了以后,研发效率会变得非常高。但研发又非常在意价值,他能够把价值表达出来,然后变成业务。这是很重要的过程。
张小珺:我很好奇DeepSeek全球爆火的时候,你这个春节是怎么过的?
李想:春节过得挺好的,还带着孩子去看《哪吒2》。
我印象应该是1月20号DeepSeek R1上线的,到后边开源,我们也在对DeepSeek做很多研究:DeepSeek很多东西为什么做得好?包括训练和推理效率,也包括MoE(混合专家模型)模型部署上去对内存占用的挑战。我们自己已经开始在芯片上写FP8(8 位浮点数格式)工程优化了。因为我们有编译团队。
比较有意思的一点是,我没有上来敢跟模型团队直接聊。我先跟谢炎(理想汽车CTO)聊了一下,我说我们本身要做VLA,VLA一个很重要的计划是到今年9月份,能做一个非常好的语言模型出来,才能再往下去训练VLA。
但今天,我们自己预测到9月份做的模型,能力是否比DeepSeek V3加R1更强?我说至少我听到你们说的东西,我说不如那个强。而且它开源开得如此彻底。
我们是否应该基于它的开源,去做我们的 VLA的L(language 语言)的部分,并且我们基于这个L(language 语言)的部分,比如我在理想同学用的话可能就是个VL(视觉和语言),它没有A(action 行动),对吧?就把vision(视觉)和language(语言)放在一起,包括做成端到端语音的一个方式。
我们原来本来应该9月份以后才能做这些,我们是否应该站在巨人的肩膀上就去做了?谢炎说肯定应该这么做。
我们比较担心陈伟(理想汽车基座模型负责人)会怎么想,这个压力是挺大的。我们发现陈伟比我们还坚决。他说这会加速我们往下一步工作,我们应该以这个为基础,加速VLA,加速端到端多模态进展,研究团队也都在研究我们如何在芯片上也跑到同样的训练和推理效率,大家都在同步地进行工作。
我跟谢炎打的电话最多,我们还有一个专门的人工智能战略小组,我们就在里边不停地聊,发现大家并不纠结。因为我们知道我们企业的基因,还是要为用户推出最好的产品和服务。
拥抱DeepSeek的过程比我们想象得要快。今天我们VLA推出的速度也会比原来的预期要快。
张小珺:你怎么看梁文锋(DeepSeek创始人)?他是怎么找到你说的所谓人类最佳实践的?
李想:我只跟他聊过一次,去年9月份,印象特别深,应该是ChatGPT的o1发布前的几天。
我自己个人感觉,两个特点:第一他是个特别自律的人。
第二,我个人认为他是会在全世界范围之内,去研究和学习最佳实践和最好的方法论的这样一个人。
张小珺:怎么理解自律?
李想:自律的最大特点就是能够坚守这些你相信的东西,能够坚守这些最佳实践,能跟人性的懒惰、走捷径,这些方面做对抗。
开源让我们更加敬佩他。DeepSeek的出现对我们加速做VLA是巨大帮助。过去我们打算要到今年年底才能做出一个像样的,能够满足需求的语言模型,但DeepSeek一开源,我们就加速了 9 个月时间,给我们带来了巨大收益和帮助。我们受到了那么大的帮助,我们在想能对社会做点什么贡献,我们就把自研的整车操作系统理想星环OS给开源了。
没有大家想的那么复杂,我自己内心,包括谢炎的内心就是:DeepSeek给我们带来那么大的帮助,我们应该给对社会贡献点什么。不让行业那么卷——说白了纯粹是感谢DeepSeek。
张小珺:自研了四年?
李想:对。如果你做得不好的东西出去,开源不就丢人吗?
张小珺:这是一种情怀,而不是一个公司战略。
李想:不是公司战略。
张小珺:所以,DeepSeek似乎带来了更多的善良和善意。
李想:是的。
张小珺:你有没有想过,DeepSeek为什么不是你做的?
李想:我只能做最好的自己。
我的人生经历——进入了汽车行业,做汽车的网站,一直在自己的长板的延长线上继续做。从最开始做个人网站,到做产品IT网站,到做汽车网站,最后希望能够改变汽车行业,推出更好的产品,汽车叠加下一代信息技术。这是我的延长线。
他(梁文锋)的延长线就是从人工智能开始。他在浙大学的就是人工智能。那是他的延长线。
本身我也相信,量化交易的公司,对于整个模型的能力,对模型的理解,对于本身工程的能力,不会比任何互联网公司差,甚至可能还要更强。
“加大投入基座模型,
训练卡比今年的预期多买了3倍”
张小珺:春节之后,很多人来问我这个问题:理想还做基座模型吗?——既然都有DeepSeek开源了,为什么还要做基座模型?
李想:因为我们的业务,意味着并不是说只是做好语言模型就够了。
我们车上要有对话,又有多模态,这个仍然需要我们自己训练一个根据我们自己需要的基座模型。包括我要去做VLA。
因为这个VLA里边,哪怕V(vision 视觉)和L(language 语言)都和正常的不一样。就是这个我需要3D的vision(视觉),还有高清的2D的vision(视觉),token(词元)要用预训练,必须得涉及更专业的车领域的语义语料,交通领域的语义语料,我们面向的家庭用户的语义语料,来做训练。
也包含很多时候,一个重要的是说,大家在做VLA训练的时候,很多时候在做基座说我要把VL(视觉和语言)也连在一起,把VL(视觉和语言)的组合语料放进去。那这些无论是OpenAI还是DeepSeek,都没有这样的数据,也没有这样的场景和需求,也不去解决这样的问题,那只能我自己来做了。
只是好处是说VLA里边的language(语言),我可以站在巨人的肩膀上,但它只是我其中的一部分。
张小珺:所以一方面是拥抱了DeepSeek,另一方面你们把基座模型的团队还拆出去了,并且加大了投入,是吗?加大投入,加了多大?
李想:首先训练卡比他们今年的预期,我们应该多买了 3 倍。
张小珺:你要训多大的模型?
李想:并不是一个固定的,就是我们现在的话,做出来的不同版本。
比如我们给理想同学用的,会是一个300B模型,就大概是个3000亿(参数)的一个模型,我们给辅助驾驶运用的VLA的,VL(视觉和语言)的部分,是个32B模型。包含我们真正工作中用的,也会去用3000亿的模型。大概现在是这样的两个版本。
张小珺:你现在觉得给基座模型打多少分?你希望 2025 年提升到多少?
李想:结果还没呈现呢。这才几月啊?
没有什么捷径。虽然我们借用了一些能力,但你没有办法直接去吃第十个包子。
如果你规则算法都做不好,你根本不知道怎么去做端到端,如果你端到端没有做到非常极致的水平,你连VLA怎么训练都不知道。
张小珺:今年2月5号,也就是春节之后,你们的第一个AI的例会,你说:DeepSeek更像是Linux推出,而你们要去追逐安卓时刻,你们准备怎么去争夺安卓时刻?
李想:这个东西是一个比喻,比如安卓是基于Linux开发出来的一个手机操作系统。
我们以语言作为基础,我们的VLA就是把vision(视觉)这部分做成最强的,把action(行动)也做好,借助了L(language),就是语言的能力。VLA就比较像在汽车或者交通领域的更重要的一个大模型或者操作系统,这是我们的机会所在。
“端到端像哺乳动物的智能,
VLA是人类的运作方式”
张小珺:我们来聊聊你们最近在做的VLA的架构。
今天的辅助驾驶走到了一个新的十字路口上,有的人甚至觉得辅助驾驶应该被叫停。你怎么想?
李想:我们这么多年,从规则算法,做到了端到端+VLM,今天真正迈入到VLA的阶段,比较像什么?像黎明前的黑暗吧——黎明马上就要来了,但会先经历一个黑暗的过程,之所以有黑暗是因为要迎来黎明。
正因为辅助驾驶行业遇到了问题,我最喜欢、最开心的方式,是去解决行业解决不了的问题,这是我们自己坚决相信的。
就跟我们推出增程,是为了解决电池成本高、充电难的问题。我们推出5C也是为了解决充电慢、等待时间长的问题。我们愿意去解决各种行业问题,包括我们做操作系统,也是因为过去,传统的车控和智控的操作系统性能差,开发缓慢,芯片匹配周期长的这些问题。这些问题(存在)恰恰是我们的价值所在。
张小珺:为什么人类一定需要辅助驾驶?为什么科技不能就此止步呢?
李想:只要人类会雇佣司机,人工智能技术就是把类似这样的功能和角色,去变成真正的生产力、生产工具,然后去进行替代。
张小珺:什么是VLA?你能不能从用户语言讲,不要用技术语言。
李想:对于我们而言, VLA是一个司机大模型,像人类的司机一样去工作的模型。
到达 VLA 不是一个突变的过程,是一个进化的过程。
经历了三个阶段。第一阶段是我们从2021年开始,通过机器学习的感知,配合后边的规则算法,包括规划、控制、执行这些规则算法分段式的。
第一个阶段比较像什么?像昆虫动物的智能。它有既定规则,还要依赖于高精地图,就比较像蚂蚁的行动和完成任务的方式。
张小珺:它能理解的世界也很有限。
李想:非常之有限,这是第一个阶段,而且效率比较低,是很麻烦的事情。
它(规则算法)就这样一个规模的脑子,包括整个模型规模大概只有几百万参数。它就那么小一个脑子,你让它去完成复杂的事情,几乎不可能。所以你就不停地限定、限定,几乎把它做成一个有轨交通的方式。跟蚂蚁非常相似。
第二阶段是我们从2023年开始搞研究,2024年推出端到端。端到端比较像什么?比较像哺乳动物的智能。比如像马戏团的动物,像人类学习怎么骑自行车。它学了人类的这些行为,人类怎么去做出各种行为开车。但是它对物理世界并不理解,只是看到一个什么样的三维图像,知道自身的速度,并给出了一个什么样的轨迹,所以它应付大部分的泛化没有问题,去面对它从来没有学到的、特别复杂的,就会遇到问题。
这时候我们也会配合,视觉语言模型 VLM,然后放进来。但是我们能够用到的视觉语言模型这些开源的,用在交通上的能力都非常有限,所以只能起到一些非常有限的辅助作用。
到了VLA,就是完全人类的运作方式了。它会像人类一样,用3D的vision(视觉)和2D的组合,去看真实物理世界,也包含它能够去看懂导航软件,这样的软件是怎么在运行的,而不是像VLM(视觉语言模型)那样只能看到一张图片。
另一方面,它有自己的整个脑系统,不但要看到物理世界,还能够理解物理世界。它有language(语言),有CoT(思维链),有推理能力。
第三,它能够像人类一样,真正去执行行动。VLA放在我们的汽车,辅助驾驶领域,我们把它称之为VLA司机大模型。
张小珺:你也可以讲讲V、L、A的关系是什么,以及怎么训的?
李想:第一个是训练环节。训练环节第一部分是什么呢?要训出来一个VL(视觉和语言)基座,就vision(视觉)和language(语言)基座。
我们目前在训的,当前这个版本,是一个32B的,就是320亿云端的基座模型,所以先训这个。这里边,跟过去这些语言模型差异在于什么?第一在于我要放入更多vision(视觉)的语料,放入vision(视觉)的token(词元)。
vision(视觉) 里面包含两个部分,一部分是 3D上的vision(视觉),物理世界 3D 的 vision(视觉) 要放进去,第二个是高清的、2D的vision(视觉)。因为今天,大家看到各种多模态的开源 VLM(视觉语言模型) 里边,它整个 2D vision(视觉)的清晰度太低,所以看的距离不够。我们放进去的基本上图像分辨率提升了10倍。这是非常之重要的。这是一个部分,是vision(视觉)的token(词元)和语料。
第二个是要放入language(语言),跟交通、驾驶相关的足够多的这方面的语料。这是language(语言)的部分。
第三个还有一个很重要的,是大家可能容易忽略的,就我们必须放入很多VL(视觉和语言)联合的语料,就是三维图像和对世界的理解语义要同时产生的。比如我举一个例子,我要把导航的地图和车辆对导航地图的理解一起放进去。
张小珺:这是原始的数据吗?
李想:没有原始的数据。
比如我要放入一个,看到导航以后人类做了一个什么判断,这个判断我们的车辆是怎么记录的,把这个语料放进去。
整个 VL (视觉和语言)基座模型训练的时候,包含了三个部分,数据是vision(视觉)的数据,language(语言)的数据和VL(视觉和语言)联合的数据。它形成一个VL(视觉和语言)的一个基座。
我要把这个基座干什么呢?我要蒸馏,变成一个 3.2B 端侧蒸馏模型。因为我要保证它运行速度足够得快,无论是两个Orin-X还是Thor-U上能够流畅运行。蒸馏下来是一个3.2B,8个专家组成的MoE(混合专家模型)模型。如果直接跑3.2B一个完整模型的话,双Orin-X和Thor-U的帧率是达不到的,token(词元)的整个输出率是达不到的第一个步骤,这是预训练的环节。
第二个步骤是什么?是做后训练。后训练是我把它变成VLA。我要把action(行动)放进来。action(行动)部分后训练什么呢?仍然是一种模仿学习。
特别像你去驾校学开车,就相当于我训练VLA,把它组合成一个VLA的端到端的一个方式,这是第二个部分。这个时候大概模型规模就会从3.2B大概扩大到接近4B,大概这么一个规模。
同时,它一方面是个VLA,能够直接从视觉,到理解,到最后的输出。但是我们的CoT(思维链)会很短,我不会做超长CoT(思维链),我的CoT(思维链)链条一般两步到三步,我不会再做更多的,否则延时太长,没有办法满足交通或者机器人的安全。
另外当我 action(行动)做完以后,我还会做一个diffusion(扩散模型)预测,就是下边会发生什么样的时长的一个场景。这主要根据性能会做出来4到8秒的一个diffusion(扩散模型)的轨迹和环境的预测。这是第二个部分,比较像人去驾校学开车这样的一个环节。
第三个部分是什么?是强化,是要做强化训练,比较像人到社会上开车了。
强化我们分成两个部分,第一个部分先做RLHF(人类反馈强化学习),带有人类反馈,所以我们有很多人类数据。就是当它这样的话,人类就会接管,当它那样,人类不会接管。包括人类的一些习惯,拿这块来做一个带有人类反馈的强化训练。
包括我们安全的对齐都是在这个强化环节完成的,你除了要遵守交通规则以外,你要遵守比如中国的大家的驾驶习惯。你的开车习惯能够融入社会,首先要开得跟整个社会环境上的大家一样好,不能给别人带来麻烦,而不是像一个新手在路上,你变成一个阻碍。
第二个部分是纯粹的RL(强化学习),是(拿RL模型放到)我们的世界模型来做训练。这块儿的目的什么呢?就是开得比人类更好。
这块儿,我们中间不会给人类的反馈,只会给一个结果,就是从a点到b点要开过去。但是会有三类的训练要求,第一个是我们可以通过G 值(加速度数值)来判断舒适性,给舒适性的反馈。
第二个是做碰撞的反馈,它碰撞了这个强化就没有完成。
第三个是交通规则的反馈,如果它违反交通规则就没有完成。所以是舒适、交通规则和碰撞事故,让它自己来做整个强化的训练。当这三个步骤完成了以后,VLA能够跑在车端的模型就产生了。
大概是这么一个方式。跟人非常像——先学习世界、交通和人类的这些知识,这是预训练的环节;后训练的环节相当于去驾校,认真地去学开车;第三个环节相当于到社会上开车,也是我们训练的一个过程,要通过人类的RLHF(人类反馈强化学习)跟人类做对齐,跟社会的环境来对齐。
另外一方面,通过纯RL(强化学习)强化,以及我们自己在世界模型里生成的数据拿它做强化训练,从而开得比人类更好,能够解决更复杂的问题,或者说,比人类的平均值要好得多,大概是这么一个过程。
这还没有完,这时有了VLA。但人类是怎么跟VLA工作的时候,我要搭建一个司机的Agent(智能体)。
司机的Agent(智能体)是什么?是人类以自然语言的方式,就是你跟一个司机怎么说话,你跟一个正常的驾驶员。假设你有男朋友,你男朋友在开车,你怎么跟他说,你就怎么跟司机Agent来说。或者一个代驾,你怎么跟他说就说了。
这里边,如果是一些短指令,通用的短指令VLA直接就处理了,不需要再经过云端。如果是一些复杂的指令,先要到云端的 32B那里,VL(视觉和语言)处理完以后,(因为它理解交通的一切) ,整个交给VLA来进行处理,大概这么运行的过程。
说白了它最后一个好处是,它能够像人类司机一样去理解物理世界,能够像人类司机一样去开车,去处理复杂的问题,也能像人类司机一样跟其他人类进行沟通。这是最后我们交付到用户那里的产品。
张小珺:这其中这些步骤里面哪个是最难的?
李想:没有办法预测。因为这些东西我们前面没有任何人走过这条路。
DeepSeek也没走过这条路,OpenAI也没有走过这条路,谷歌、Waymo也没有走过这条路。
我们走的是一个无人区。
张小珺:你们为什么就押注了这条路呢?VLA的技术路线还没有收敛,为什么你们觉得你们可以?
李想:交通领域应该是VLA最早实现的。
一是规则清楚,包括你说做强化非常容易。按照每个来讲,交通的世界,一个车会跑到哪里?是有规则的,虽然它很复杂,但是确定的。车又不能开到水里,车也不能开到空中,车只能开到有路的地方,它是复杂但具备确定性。
第二是车的控制,车是个3 DoF(自由度),车有三个自由度。左右是一个自由度,前后是个自由度,某种程度上还有一点轻微旋转,是个自由度。甚至辅助驾驶某种程度就控制两个多,撑死就三个自由度。如果这个不能实现,机器人的上来就是40多个自由度,那个挑战就更大。
所以这时候,我们进行模仿学习是特别容易的。车看到的就是人看到的,人操作的就是车操作的,所以第二个它能做特别好的模仿学习。
第三,它还能做特别好的强化。大家在使用的过程中不满意的时候就接管了,如果这个跟人类没有对齐,它就告诉你不应该这么做,以及告诉你该怎么做,这是非常清晰的指标。
包含哪怕不做,包括后边我不做人类监督,我靠生成数据来做训练的时候也非常清晰。因为什么是舒适,G值(加速度数值)是可以表达的。什么是符合交通规则是能够表达出来的,交通规则是个清晰的规则。
第三个是否发生碰撞是可以表达的。如果它很舒适,又不违反交通规则,然后第三个,又没有发生碰撞,a点到b点它就会开得越来越好。它是VLA第一个重要的实验场。
张小珺:V、L、A还有包括VL,哪个数据获取难度是最大的?
李想:vision(视觉)和action(行动)。
vision(视觉)和action(行动)的数据是因为车,我们装满传感器是可以收集物理世界数据的,还有人在车上开车是我们可以收集到action(行动)数据的,这两个是最难的,而且也没有任何公司可以替代。
张小珺:其他车企不行吗?其他车企也可以啊。
李想:但是其他车型你有没有建立整个基座模型、预训练的能力,后训练的能力,以及后边强化的能力?因为强化还需要世界模型的能力,这是不一样的,对吧?
包括我刚才讲的,本身我们怎么去解决很多问题,比如说我讲一个问题,第一个如何提升能力刚才讲清楚了,第二个是说我如何向人类安全对齐,我如果让它像一个职业司机一样足够的安全,足够的舒适,所以我们本身能够要建立强化学习的体系。我们的RLHF(人类反馈强化学习)是很重要,我们有一个成规模的团队了。
因为很多时候一家公司如果模型能力不强,根本不知道怎么去对齐。因为你模型能力强的时候,你才发现对齐重要性,你才知道Ilya(伊尔亚·苏茨克维,OpenAI联合创始人)原来想得那么远。Ilya把很多事情想得那么远。
张小珺:怎么说?
李想:因为模型能力越强,也就意味着它胡来的可能性越高;就跟一个人能力越强,我需要他的职业性越强。
公司规模越大,越需要职业性。公司小时候不需要职业性,因为一个人能力强的时候,他干好事也很强,干坏事能力也很强,所以这时候就需要职业性来约束。
举个例子,我不可能雇用一个职业赛车手每天给我开车,但我要雇一个职业司机,他除了开车能力不错以外,他有非常强的职业性,保证舒适、安全、价值观能够对齐,所以这是很重要的工作,我们就能做得非常好。
第三还有最大一个挑战,就是模型是一个黑盒子。怎么解决?我们做了世界模型。我们把VLA放在世界模型里,一个交通世界模型。它是一个如果不跟你说的话,你看的跟一个真实世界是一样的。
“如果模型是这个人的专业能力,
超级对其就是职业性”
张小珺:模型是一个黑盒,怎么解决它?
李想:我们很早做端到端就意识到,模型的黑盒子问题必须得一起解决。
我们当时做的世界模型,或者说是叫交通世界模型,就是我们用重建加生成的一个方式,借助我们的数据,来构建了真的、交通的一个物理世界,包含参与者、参与物、所有固定物体,是非常重要的。
我们就可以让,无论是最开始的端到端还是今天的VLA,在模型里边考试,它会模拟真实交通的参与,包括真实的这些城市,来进行考试。而且考试跟我刚才讲的强化训练非常类似。它考什么呢?a点到b点,考它的舒适性、交通的合规性和安全性。
这是我们要一直在做的这方面的工作。这时候就能非常好还原了,而且基于这样一个我们的模型或者真实物理世界的仿真能力。我们还把整个验证成本大幅下降,过去我们靠人类司机来做一万公里验证,每一万公里成本大概在17万到18万人民币,算上车的各种费用,今天我们大概只需要花 4000 多块钱人民币,就每一万公里。那这4000多块钱基本上都是算力为主的成本,而且解决问题的效率还提升的多得多。
为什么呢?比如说今天,我们要解决一个问题,这个问题产生的时候,是我们自身的车辆跟多个交通参与物在不同位置上,还有不同道路上,出现一个问题。但是如果你靠人类去验证我有没有解决这个问题?要把这几个交通参与物,相同的位置、相同的速度,凑在一起,几乎没有可能。只能模糊的验证。
但今天,我们有了世界模型,我们可以非常准确地验证。我们修正以后的模型有没有解决这方面的问题,可以100%还原一模一样的、真实的场景,在世界模型里,进行验证。
张小珺:我们在说司机Agent(智能体)的时候,它涉及到action(行动)进入了外部世界,进入了物理世界。怎么解决安全问题?这个非常重要。
李想:我们从去年年底成立了超级对齐团队,比如说模型能力很强,但不遵守交通规则,去在交通拥堵中去加塞。
它做出来一些让人类坐在车上感觉到不安全行为,至于是否让它碰撞,是模型能力的问题,是否产生这些问题,是这个价值观,是这个模型要去做的对齐的这方面的。
所以这也是刚才我讲的,就是说我们要在做强化,训练的第一个环节,是我们必须把人类的这些规则、习俗、驾驶习惯,对于很多东西的判断,变成它整个的要训练的反馈。这个我们必须要做的。我们有一个挺大规模的、100 多人的超级对齐团队。
因为你能力越强、责任越大,这是责任,或者你还可以用另外一种方式,我们把超级对齐如果拿一个人举例子,模型相当于是这个人的专业能力,然后超级对齐,是这个人的职业性。
司机Agent(智能体),包括司机背后的记忆能力是如何和使用者建立信任的。
我是否认可一个员工,同样是看他三个:第一个,是看他的专业能力,第二是看他的职业性,第三是看他对别人理解和构建信任的能力——这三个都很好,是最卓越的员工。
张小珺:超级对齐,是什么时候开始做的?
李想:是我们做到了1000万Clips(视频片段)以后开始来做的,因为我发现这时候怎么去有效的运用模型的能力就很关键了。
举个例子,它经常一拥堵就去加塞,这个包括它做的很多行为,虽然效率很高,但是人坐在车上是很不舒服的,因为跟人类的一些处理方式或者跟正常人类处理方式不一样,它可能学到了一些不该学的司机的行为。
张小珺:大家说创业做AI是“造人”,你们这个就是在“造司机”。
李想:是的。我一个很重要的感觉是,我们只有让它变成一个真正的司机,它才是一个生产力工具,不只是一个辅助工具。
今天L2、L2+是辅助工具,辅助工具还需要人大量的参与。但如果想变成一个生产工具,我个人认为并不会出现通用Agent(智能体),而是每个专业领域做专业的Agent(智能体)。
就我刚才讲的一样,要想开好车,它所有的vision(视觉)语料、language(语言)语料和action(行动)都是不一样的。你想做好一个医生,你想做好一个律师,背后的思维链,所有的数据都是完全不同的。
另一方面,如果你想变成一个生产工具,这时候就会和专业的人进行比较,比如说你是否比一个专业司机开得更好?你是否比一个专业医生表现得更好?你是否比一个专业律师表现得更好?你是否比一个专业程序员表现得更好?因为你会影响到它的整个生产、业绩、工作结果,甚至它的财产和生命安全。
这是我们看到的终点,这也是为什么我们必须很耐心、很深入地去解决,哪怕一个司机的问题。
它并不可能通过一个泛化的大基座模型,或者一个大语言模型,这些东西都能实现了,这不现实。
张小珺:什么是一个好的司机大模型的北极星指标?
李想:还是把司机大模型和Agent(智能体)放在一起,这才是一个真正用户能够使用的一个产品。
如果是一个司机大模型,跟人的判断是一样,就我判断一个司机,就我们家雇用了一个司机,第一是他开车水平好不好?是他模型能力强不强?第二个还是说他是否职业?他是否职业,很重要的一点就是我们的超级对齐这方面的工作,包括强化训练,是否做得足够的好?第三个,是否安全?第三个是他跟我之间的信任的关系,我是跟他说什么他都听不明白?还是我说上半句他就知道下半句,甚至我很多东西不说,他已经对我的记忆里边都可以独自去完成了。
我们如何通过Agent(智能体)和记忆来构建一个更好的信任的关系和理解的关系?如果我什么都不说,他都知道我要干什么了,这个司机要同时又满足了他开车不错,又很职业,他又对我特别理解,我就会一直雇佣他。
最后我们对司机的Agent(智能体),对整个的这一个司机大模型,司机Agent(智能体)的判断也是一样的。以后所有AI的或者Agent(智能体)的判断都应该是这样的,它的专业能力,它的职业能力,以及它给你构建信任的能力。
张小珺:你觉得这个Agent(智能体)应该怎么定价?
李想:我们雇用人类费用的几分之一,至于几分之一最后还是看把成本都算出来以后,比如说我一个月,我雇一个司机,1万块钱,我是否愿意?2千到3千雇佣一个司机。
这可能是一个比较重要的判断,当然它也会带来其他商业模式的不同。比如你花2千到3千块钱雇佣一个司机,那可能你对车而言,也不需要付保险费了,保险费也包在这里边,保险费用就财产的保险,这个财产险的费用也包含在里边了。到最后算下来,可能是个更划算的一个事情。
张小珺:有可能一步直达 VLA 吗?比如去年不推出端到端加VLM(视觉语言模型)那个版本,直接研发VLA。
李想:没有可能,至少从我们自己的体验上没有可能。
我说不太好听的话,没有办法直接吃第十个包子。虽然可能大家觉得第十个包子吃饱了,但前面每个包子都跳不过去。往往很多时候,如果大家不想做前面任何包子的积累,只想吃第十个包子,很多时候非常像练葵花宝典。
今天包括DeepSeek的出现并不是练葵花宝典练出来的,过去它很早就构建这种集群的能力去做这些链路、基建的优化,都是非常之重要的。所以才有了它的低成本和效率。我们特别喜欢讲这种,有一个人很聪明直接吃到了第 10 个包子,但现实中,至少今天这个社会整个的知识文明发展得越来越好了,不是胆大大于一切,我看不到什么捷径。
张小珺:但是大家就觉得李想才是摘第10个包子的人,因为你们做辅助驾驶的时间比别人晚。
李想:但我们自研的时间并不短啊。我们从2021年,上地平线征程Journey3芯片的时候就开始做自研。我们研究做得也很扎实。中国的所有企业里边,关于辅助驾驶的论文我们应该是发表,以及被大的会议、大的社区录取和引用的应该也是最多的。这个阶段我们还是做的挺扎实。
因为我们是个用户导向的公司,我们认为技术是一种能力,我们更多的时候讲的是用户的价值。今天大家讲我们是冰箱、彩电、大沙发,但我们的这个冰箱、彩电、大沙发的智能化背后的基础,今天大家看仍然是非常强的,体验起来是完全不一样的。
张小珺:背后的基础是什么?
李想:就是大型软件的能力。我们后边很多能力还是很扎实的。
比如举一个例子,为什么今天大家做端到端和VLM(视觉语言模型)很难?是因为这个Orin芯片并不支持直接跑语言模型。我们是自己的编译团队,所以我们特别理解DeepSeek,一看就看明白了,比如它做FP8(8位浮点数格式)的优化,能够跑它的整个训练的一个架构。
我们做相同的事情,我们直接然后是写了Orin-X底层,因为英伟达没时间,我们自己写的底层(推理引擎),让它用INT4量化的方式来跑VLM(视觉语言模型)。
那这跟DeepSeek做FP8(8位浮点数格式) 的训练一个道理。包括今天,我们为什么能做到双Orin-X跟Thor-U都能跑VLA,可能对很多团队是个非常大的挑战,为什么呢?
因为我们自己有非常强的能力,我们有编译团队,我们有芯片的能力,我们有板子设计能力,有操作系统能力,所以我们是能够把两个Orin-X带宽足够的大,它同样可以跑同等规模的VLA的模型。
我们这方面的技术都是非常之扎实的。因为我自己还是认为,就是你规模小的时候无所谓,你规模大的时候基本功和能力永远是无法逾越的。
张小珺:什么样的corner case(长尾案例)是端到端加VLM(视觉语言模型)架构无法解决,而VLA是可以解决的?能不能给大家举个例子。
李想:有两个。
过去端到端有两个麻烦的问题。
第一个问题是它对复杂东西的理解,比如这有一个复杂的修路,如果是规则算法可能就会撞上了,如果是端到端可能停下来,但它不知道该怎么干了。如果是VLA就能轻松解决了,而且这些我不需要有真实的场景,甚至我可以直接生成,然后来数据来进行训练。
因为它能够有理解能力了,它并不是只是看到一个景象,就做出一个结果。规则算法往往可能就会出现,遇到一个复杂路况,复杂的、没见过的,或者规则之外的它就会出现事故。如果是端到端的,它可能停下来,但它不知道该怎么办了,我们经常遇到修路状况,它在那不知道犹犹豫豫,不知道该怎么办,对吧?但是如果VLA,它就能够有效地去处理了,而且不需要通过海量的数据训练。哪怕最开始这个场景没有办法处理,但我保证三天之内相关的这种场景都能处理,因为我可以拿这东西来生成数据,生成让数据来进行训练。这是一方面。
另外一方面还有很难的一点是跟人沟通。今天端到端怎么做?就跟猴子一样,你影响不了它。比如说我们会经常遇到一个什么样的状况,就是在一条路上三条道,最右侧的车道是公交车道,然后又是限行,但是公交车道长久没有维护了,那个印刷已经不清楚了,所以它就会在那跑,虽然你可以通过一个调整说,回到中间车道,但它过一阵又跑到那条车道上去了。
如果是人类有了Agent(智能体)以后,因为有了VLA才有Agent(智能体)能跟VLA沟通。所以我可以跟一个Agent(智能体)讲说,接下来这条道路一直在中间行驶,直到它在导航的时候走了下一个。包含如果跟导航错失了以后,端到端就不知该怎么办了,但是VLA在小区里可以漫游。
在一个开放空间里,它可以先处理完以后,最后再跟导航调整以后的进行汇合,它跟人类完全一样的了。只是今天可能它作为一个人类,能力还没那么强,作为一个人类能力还有一个成长的过程,比如它今天像一个刚从驾校学完的新手司机,有可能是这么一个状况。
张小珺:今年都会是这个状态吗?
李想:还是看整个训练的一个进度了。但它泛化能力是完全不在一个量级上了。
张小珺:VLA是终极的架构吗?还会有下一代吗?会不会明年这个时候又是新的架构了呢?
李想:我自己认为VLA能够解决到全自动驾驶,但是VLA是否是一个效率最高的方式?是否有效率更高的架构出现?我打个问号。
我认为大概率还是会有的啊。因为VLA还是基于Transformer这样子的,那Transformer是不是一个效率最高的一个架构,这个后边不知道。
张小珺:VLA跟最后可能形成的最终大统一模型的关系是什么?
李想:还是会有一个效率的问题。
我们虽然有模型,但我们从来不放弃工具,因为工具是增加确定性和提高效率的。
我还是举一个挺清晰的一个例子,因为团队很多时候太想用模型解决一切问题,对吧?这时候就会出现类似一个现象,比如我举一个例子,今天当然VLA会解决很好了,我们在使用 VLM在解决ETC车道时候并不好。
因为VLM(视觉语言模型)对于位置的判断是很糟糕的,它如果是两到三个ETC车道,我怎么进入非常容易判断,就是这个左中右。但如果像京承高速这样的机场高速那样的十几个ETC车道,它很多时候就不知道怎么处理了,就开始非常混乱,因为它没有位置的判断的能力,我们团队太希望用模型去解决问题,就是说不停地去给VLM(视觉语言模型)喂更多的语料,更多的东西,都没有解决这个问题,因为这是VLM(视觉语言模型)的那个架构问题。
我跟团队说,解决ETC为什么不能用规则算法?因为最多的也有15个口。 15个口对于你们而言,写一个程序基本上一周之内就能完成,甚至三天就能完成。但我说很多时候我们心里有个心结,因为人类很多运行的时候是大模型运行,但我说我们作为正常的人,我们也会背乘法口则,乘法口则就是个规则算法,但是乘法口则的结果是我们消耗的脑力更少,我们消耗的token(词元)更少,以及我们的准确性更高。所以它就是个好东西,它就是个工具。
如果是一个确定性的,能够拿规则去解决的,它意味着更低的能量消耗、更低的算力消耗和更高的准确性,为什么不用?团队很快就把问题解决了,我们在ETC就非常稳了。一周都不到就解决了,过去解决了三四个月都解决不了的,成本很高的方式解决不了的。
所以真正往下去落的时候,很多时候还是要考虑效率,今天DeepSeek之所以受到全世界的瞩目,很重要的一个原因还是因为它的效率变得更高了。
张小珺:特斯拉FSD真实进入了中国,对你有没有什么影响?
李想:我们认为,我们自己一个判断,从实测过来,他们大概在用12.5之前的模型。距离特斯拉真实能力还有巨大的差距。
特斯拉13.0以后的能力还是非常强的。而且12.5之前的话应该是这个半规则算法的能力。所以我说不是特斯拉真实能力的体现,但是我们能看到特斯拉基本功是非常扎实的。它的整个的感知的距离,它整个运行的帧率,它整个的车辆的整个的控制的稳定性。
张小珺:为什么没有释放真实的能力?
李想:因为如果直接上端到端的话,有中国的这些路况什么的,刚才我就像我讲的,它在美国没有学习到这些东西,再遇到这些复杂的,是还是会遇到挑战的。
张小珺:你们现在还学特斯拉学的多吗?最近从他身上学到了什么?
李想:美国的很多的顶级公司,像苹果,像特斯拉这种企业,就是他们基本功特别扎实。
我们真正要去学的,尤其是在今天这种内卷的环境下,包括外部的不确定的环境下,是每个企业扎扎实实练基本功的最好的时候。
而且到了人工智能时代,基本功就更是不可跳跃的。如果很多企业做了很多的创新,但是没有基本功,不扎实,所以很多创新就会昙花一现就过去了,所以这会是很大的问题。
因为就它虽然拥有很多钱,能发明了很多东西,就创造、创新了一些很多的功能的组合。但是你会发现能力强的公司复制的东西基本上在人工智能时代都是按周计算的就能复制过来,所以那个能力的基本功还是非常重要的。
张小珺:为什么是学苹果?它也不是一家 AI 公司。
李想:最重要的是学能力。
我们在小的时候没有看明白,没有看懂苹果,那这个阶段的时候我们可能又去认真研究苹果,发现苹果还有很多能力值得我们去学习的。
到今天为止,你去看一个苹果作为一个全世界市值第一的公司,当你做到千亿收入,你再去看这种万亿收入公司的能力的时候,你开始模模糊糊能看懂一些了。
但是我们小的时候,我们很小规模的时候,我们看不懂苹果为什么这么做。最后是规模,因为规模是一个可以确定衡量的变化,也会带来用户规模和用户需求的变化,技术和产品的变化,也会带来组织和能力的变化。
“关注人,
尤其关注亲密关系的人”
张小珺:7月份是理想的十周年,站在今天回顾理想这十年走过的路,你脑海里浮现的最深刻的场景画面是什么?
李想:我的第一个最重要的画面,是2018年理想ONE第一次发布,一直延续到2019年的4月份,上海车展第一次正式的展示,带有价格的。那是一个非常重要的时刻,我们真的能做出来一辆车。
另一个是2022年发布理想L9的时候。到了今天2025年,能看到至少有5个以上的企业是因为当时理想L9的成功,在打造跟理想L9相同的产品。
张小珺:你脑海里浮现的都是幸福的时候,而不是痛苦的时候。你会回忆到痛苦的时候吗?
李想:太多了。刚经历了L9的幸福就出现了,那一个季度我们亏了十几亿,将近二十亿,原来从没亏过那么多——忽然从巅峰掉到谷底。
好处还是我说的,我们认识到很多能力不足,我们就去补了很多能力。但正是因为这件事情,我们的调整又带来了2023年获得接近三倍的增长,我们直接做到了1200亿的收入。
反正我创业那么多年了,当问题来的很多时候,又是一个更大的机会的到来。所以我对这方面也没那么纠结。
我对于不正常的事情耐受力很差,但我对于一些不好的东西解决完以后,整个记忆能力也很差,会把它忘掉,但你让我回顾还是能回顾过来的。
张小珺:刻意删掉的记忆片段会是什么呢?
李想:为了让自己有更好的正能量,我还是尽可能的只保留那些有价值、美好的片段。
哪怕是一个不好的东西,比如刚才讲的我们被黑、被打击,我会转变成“看,正是因为这件事情我们增长了三倍,我们获取了其他新势力没有的能力,我们面临其他新势力没有的挑战。”这样的方式来表达,这是一种心态。
创业确实不容易,但是没必要苦哈哈的。苦和甜。是一个硬币的正反面,取决于你选择看哪一面。
张小珺:甜多还是苦多呢?
李想:如果按时间轴而言,肯定是苦更多,但是吃苦多了也就习惯了。
张小珺:余凯博士(地平线创始人兼CEO)回忆跟你第一次见面是在杭州一起去爬山,你那天穿了一个军大衣。我很好奇余凯博士见到的那个军大衣里包裹的是一个怎样的灵魂?它跟今天发生了什么样的变化?
李想:没什么变化。我甚至认为我今天90%的状态、思维方式跟上高中差不多。
遇到问题解决问题、解决别人不愿意解决的问题、解决消费者遇到的最大问题、去找更多人学习。那时候我是个人网站站长,但我又有合伙人,是少数有小团队的站长。靠自己能力不行的时候还要靠别人,继续完善能力。到今天为止我没变化,只是解决的问题在变大、服务的用户群体在变大、公司的规模在变大、组织在变大。
张小珺:过去十年中所有的记忆里如果能改变一个记忆,改变一个程序,你想改变什么?
李想:没什么要改变的。能赶上这么一个时代,几次创业还能一路走下来,在最难的时候都有人来帮你,当遇到问题的时候,总是能从坑里快速爬出来,一帮人齐心竭力变得更好,挺幸运的了。
无论是从运气层面,还是从能够创造出来的价值层面,没什么可后悔的。挺好的。
张小珺:怎么让自己成为一个更有能量的人,更强大的人,或者是能吸引到更多能量的人?
李想:就是关注人,尤其是关注那些离你最近的人,关注亲密关系的人。
关注人的时候首先你得先关注自己,作为我自己,我会怎么来看待自己?
第一,我会接受自己所有的优点。我很多身上的特质,这么多年的积累,从DNA里带来的,它就是我的优势,我应该怎么去发扬自己的优势。
第二个是要能接受自己的不足。往往不足就是优势的另外一面。比如这个人很擅长决策,他可能就没有办法去做很细致的运营,因为这两件事是冲突的。有的人非常擅长运营,他可能就很难跳出来,或者跳好几个维度来去做决策。
一个人很懒,但可能是个极品的产品经理,但如果他很勤奋,应该是个非常好的业务运营。每个人是不一样的,往往我们如果要改的话,会变成一个更差的别人,以及一个更糟糕的自己。所以我说要接受自己的不足。第三个是用成长替代改变。更重要的是我有没有成长,我们在做汽车之家的时候,我说做好业务就行了,资本根本不重要,最后我们折在了资本上。
在做理想汽车的时候就非常注重资本,请最好的FA(财务顾问),请最好的律所,股权架构的设计、投票权,今天大家可以看到所有的新势力企业里面,理想汽车的股权架构、治理结构、资本现金管理都是做得最好的。我并没有改变我的业务,是增强了一个能力,所以它是个成长。
我们会面临方方面面的能力成长,就能给自己带来能量。你的成长有自己的能量,然后你又不跟自己纠结,当有这个能力的时候,我们再看待别人也是一样,我会先看别人的优点,这非常重要——这优点能带来什么?这优点怎么让他发挥?
第二个,当看到别人不足的时候,根本不是问题。我从创业开始就有合伙人。樊铮就是我的互补,是我所不具备的,秦致是我所不具备的,李铁、马东辉、谢炎、邹良军就是我所不具备的。当看到大家这些不足的时候,反而是我的价值,我有价值能帮助到他,他有价值能帮助到我。
第三个,去看别人的成长,你能看到孩子的成长,你能看到爱人的成长,你能看到身边每个同事的成长,这就有能量了。
张小珺:成长带来能量。
李想:对,因为变好就有能量嘛。而且你关注的是人的成长,不是那些事儿。所以,第一你能自己产生能量,第二你能够带给别人能量,第三你能从别人那获取能量,因为别人给你能量,别人也不会丢掉能量,它是个辐射作用。所以这是我一些随着自己的成长,开始有效的一些理解。
另外一方面很重要的是亲密关系,亲密关系里边特别重要的一点,是要关注人,我需要我的爱人,我需要我的孩子,我需要李铁、马东辉,我需要刘杰、解卫国、范皓宇,甚至超过了他们需要我。首先是我需要他们,才是他们需要我。
这时候这些人之间的连接就不一样了,我们在一起就能形成一个非常强的脑力、非常强的心力,形成特别好的能量,这个是特别重要的,而不是说我对他们没有需求。
张小珺:你最近看见的一个人是谁?
李想:在我的家里非常有意思的一点,过去我和我老婆之间的相互支撑还是有限的,从去年年底春节过后一个最大的变化是我们家大女儿她形成了我们的第三个支撑。
她14岁了,她对事情的理解在发生巨大的变化。她自己的三观开始有效、特别完善地形成,而且超出了我们的预期。而且她有能力跟我们做特别好的沟通了,关于她自己的人生规划,她自己的喜好,她自己对人和事物的理解,这个特别有意思,我们家里实现了一个三人的支撑,这是个让家里的能量大幅地提升。
因为这些能量会影响到其他的孩子,虽然他们还没有办法做成支撑。我每次跟我老婆聊,在聊到大女儿的时候都是非常的高兴,就没想到她14岁就能和我们两个人形成一个三人的支撑了。
我们能跟她一起去讨论很多问题了。我们可以讨论事情,可以讨论人,可以讨论不同的见解,也可以讨论她的规划,可以讨论怎么出去玩,可以讨论家里要解决一些什么问题,都可以的,这个特别好。
张小珺:我之前跟一个教授聊天,他说他几年前跟你聊过,感觉你的心灵观就是家庭观,这个也反映到你的公司上,要创造“幸福的家”。他想问的是,你有没有更大的宇宙观、世界观?
李想:我们从人出生开始,上学到大学毕业到开始工作,我们有多少自己想去做的事情没有去做?我们有多少想接触的万物没有去接触?我每天都在忙着去工作,去在做事儿。但什么是智慧呢?智慧就是我们跟万物的接触。
如果你没有去过森林,没有在森林里,认真的玩、住过几天,那你可能觉得木头就是做筷子的,就是做纸的,就是做桌子的,而并不是意味着它是一个生命,它是跟我们不同的生命。
你不能没有跟孩子在一起、长时间的生活体验跟他们一起去玩,你可能就不知道什么是亲密的关系,你就没法真正的去理解孩子,去了解孩子。
什么是智慧?智慧就是我们和万物的关系。但是怎么去提升我跟万物的关系?首先要有足够的时间跟万物去接触。所以我在讲的一个很重要的一个问题,就是今天我们很卷,但是这是恰恰是真正的人工智能的意义。
张小珺:在AI面前,什么是值得被保留的人性?
李想:所有的人性都应该得以保留。无论是好的和坏的。
张小珺:为什么要把坏的(保留下来)?
李想:没有坏的,就没有好的。
一个人的优点的另外一面,就是它的缺点。一个好的另外一面就是它的不好。我们如果只想要好的东西,但放弃所有不好的东西,这件事情并不成立。你可以把好的东西和不好的东西都当成一种特质。
它是文化的特质,它是生命的特质,它是性格的特质,它是能力的特质——这样才是一个有生命力的世界,才是活生生的人。
2025-04-28 12:30:41
腾讯新闻《潜望》特约作者 冯彪
编辑 刘鹏
量化私募基金在2025年迎来一轮新的发展周期。
“2024年,我们经常面临客户的‘灵魂拷问’:你们会不会被暂停?”一位知名量化基金的高管提起去年的舆论和监管压力,还有不少苦水,他只能再三解释,量化交易和饱受诟病的高频交易并不等同。
去年以来,量化投资多次被股民和部分专家学者喊话叫停,甚至一家知名量化机构直接被交易所限制三天交易。深陷争议漩涡的同时,投资者赎回资金,量化私募机构的管理规模普遍收缩,业绩下滑。
然而,“忽如一夜春风来”,DeepSeek火爆全球,量化私募机构幻方投资及其创始人梁文锋以一己之力跨界超越一众科技公司,甚至改写了AI大模型的国际竞争格局。与此同时,梁文锋昔日的投资业绩,他对量化投资的见解再次被市场关注和热议。可以说在量化投资饱受争议之后,梁文锋一定程度上为量化投资实现了“正名”。
“以前大家提到量化就是割韭菜,消灭了散户和游资。”上海某百亿级量化机构合伙人李涛(化名)表示,“今年我们都接待了几拨地方政府的调研来访,高净值客户的咨询关注也比往年多了,这种情况前些年没有过。”
争议漩涡中的收缩
2024年,A股多次大幅下跌,最低下探到2700点以下,在历次3000点“保卫战”中,部分投资者将矛头指向量化私募机构,特别是量化机构常用的高频交易饱受诟病。
特别是2024年2月20日,一则处罚通知将量化行业推上了风口浪尖。宁波灵均投资在前一个交易日开盘1分钟内大量卖出沪深股票合计25.67亿元,导致A股大幅跳水。虽然当天灵均投资整体是净买入1.87亿,但是因为开盘期间的大量卖出仍被交易所施以限制交易3天并公开谴责的处罚。
市场声讨量化投资的声音不绝于耳。某知名经济学家在社交平台持续呼吁:“指数涨到4000点要果断地暂停量化交易”、“不要让量化交易割了耐心资本的韭菜”。
在负面名声传播的同时,客户信任度明显下降,加之超额收益的回撤,客户赎回的意愿增加。从2023年到2024年,量化基金经历了管理规模的缩水。中信证券的一份研报显示,2024第一季度期间,量化基金规模从3169亿元下跌至2879亿元,在权益公募基金中的占比从5.0%下降至4.6%,为近5个季度首次下降。该报告显示,截止2024年6月,国内股票量化私募管理人的资产规模约7800亿元,相比2023年末的1.21万亿元显著下降。
行业统计数据也显示,在2023年之前,如幻方量化、九坤投资、灵均投资、明汯投资等第一梯队的量化机构管理规模超过600亿,但是在2024年也一度收缩至600亿以下。
另一家百亿级量化机构品牌负责人徐伟(化名)还提到一个细节,在2022到2023年量化行业火爆的时候,给优秀的实习生薪酬都能达到每日1000到2000元,如果日薪在500元以下连个实习生都招不到。但是在舆论反转的2024年,行业口碑变差了,量化私募圈变低调了,给实习生的工资跌了50%。
不过,除外部压力外,量化基金这一波的收缩周期也与机构内部原因有关。一位头部量化机构高管张燕(化名)提及:“我们的规模突破500亿后,很快就又超过了600亿,但是募资经验不足,管理规模扩张太快,超额收益出现下滑。但是客户是因为看到产品之前的高超额收益才来投资的,进来后收益下滑了,客户的不满情绪增加。所以我们也吸取教训,主动控制规模,避免走得太快。”
此后,适度控制管理规模,也成为其它几家头部量化机构的共识。
名声好转
2025年春节前后,DeepSeek突然火遍全球,原本只是量化私募机构幻方投资的投研和IT部门,却在全球顶级科技公司的竞争中崭露头角。
“2023年4月,幻方量化官方公众号发布‘英雄帖’招兵买马,宣布探索通用人工智能(AGI)新征程。我们当时有些不解,以为梁老板只是要做金融场景的AI模型。甚至在当时量化面临的舆论环境下,不少人还觉得幻方是不是要‘割韭菜’。”张燕感慨,“现在回想,当时很多人都太小看梁老板的格局和魄力了。”
梁文锋追寻人工智能“星辰大海”的理想情怀,让他在业界几乎成为神话般地存在。他在过去几年对量化投资的讲话再度在网络流传,他转述量化投资“教父”詹姆斯·西蒙斯的名言“我们总有一种办法能对价格建模”,让市场重新思考量化投资的最底层逻辑。梁文锋还说,“我们的目标是提升中国二级市场的有效性”,一句话甚至可以改变市场对量化投资割散户韭菜的刻板印象。
更重要的是,对量化投资来说,如何影响监管层的看法或更加重要。据张燕介绍,去年以来量化机构与监管部门的沟通交流更加常态化。“通过与监管机构定期的沟通交流,监管也在逐渐加深对我们的了解,特别是对我们的底层投资逻辑、工具方法有了更清晰的认识。”
她如此感慨,“监管层面的一句‘规范发展’,就已经让我们感到很大的鼓舞了。”
随着舆论环境的好转,今年地方政府前往量化机构的调研也多了起来。特别是深圳的动作更大。今年2月27日,深圳私募基金业协会在深圳证监局、罗湖区政府的联合指导下,组织召开了16家私募量化机构的技术总监召开调研座谈会。与往年市场上“谈量色变”不同,深圳还提出加速从“传统资管重镇”向“全球量化创新枢纽”升级,打造量化投资新高地。
在有效监管和规范发展的方向下,监管规则也在日益完善。2024年5月,证监会发布《证券市场程序化交易管理规定》(试行),明确了交易监管、风险防控、系统安全、高频交易特别规定等一系列监管安排。
今年4月3日,沪深北交易所分别发布程序化交易管理实施细则,进一步加强程序化交易监管,该细则将于7月7日开始正式实施。该细则为程序化交易的规范发展提供了指引,比如明确了瞬时申报速率异常、频繁瞬时撤单、频繁拉抬打压以及短时间大额成交四类异常交易行为的构成要件。
实际上,量化投资和程序化交易、高频交易有很大的区别。量化投资以数据为基础、模型为核心的投资方法论,通过数学、统计学和计算机技术分析市场规律,通常以程序化交易为工具。有意思的是,詹姆斯·西蒙斯早年就是手动下单的,但是他的底层逻辑就是量化方法论。
监管方案的出台和细化也在引导量化机构的策略方向。在李涛看来,监管实际上是在引导大家不要过多地关注量价策略和高频策略,他所在的机构近年来也加大了对基本面策略和数据的倾斜。
“现在监管限制了高频交易的速度和规模,比如每秒不得超过300笔,每个账户每日不超过20000笔。现在大家的交易频率都明显下降。其实大家都去卷这些高频和大家都不卷,效果可能是一样的。现在监管作出限制,实际上对大家都有好处。”李涛说。
降低交易频率逐渐获得行业多家机构的共识。一家2022年成立的新锐量化基金相关负责人赵雨(化名)也表示,所在机构更关注对市场长期规律的把握,而非短期波动的追逐,其使用的低频策略仅使用不到10%的高频量价因子,其核心预测模型是预测未来一个月的股票回报,交易频次更低。
重启人才“军备赛”
管理规定和细则的出台,让量化交易更有规可循,合规操作也减少了被暂停交易的担忧,加之DeepSeek带来的舆情催化剂,量化投资迎来新一波的发展周期。今年以来,不管是头部机构还是中腰部的机构,都开启了新一轮规模扩张周期。
以李涛所在的百亿级量化机构为例,该机构管理规模在2024年7月左右跌至100亿以下,去年四季度基本上重回100亿规模,截至今年一季度,已达到了110亿规模水平。
另据业内统计,今年一季度,第一梯队的幻方量化、九坤投资、明汯投资、衍复投资管理规模重新回升到600~700亿,宽德投资的规模也超过500亿元。其它中腰部机构如量派投资、茂源量化管理规模均有一定的上升,跨入200~300亿队列。
而且,今年以来量化机构备案新品更趋活跃。在截至2月底新备案的1303只产品中,量化策略占据绝对主导地位。其中最为活跃的机构当属宽德投资,一家机构就备案了59只新产品,相当于每备案10只基金就有1只来自这家量化巨头。
与前两年的低调相比,知名量化机构再次开启”抢人才“的模式。正定私募基金的一则招聘信息显示,给予实习生每天1000-3000元的实习薪资,外加项目奖金。这意味着实习生的基础月工资最高可超过6万元,这恐怕比其他很多行业正式员工的工资还高了。
高薪背后,是量化机构对顶级人才的争夺。例如,上述招聘对应聘者的要求包括:获得过数、理、化、生、信息学全国奥林匹克竞赛金银牌,或者在计算机、数学、机器学习等领域的顶级刊物发表过论文。给实习生开出这样的薪酬,也是希望提前锁定这些优秀的人才。
马太效应会不会来?
量化投资的新一轮周期呼之欲出,不过当下的“江湖”已今非昔比。
最典型的变化就是量化投资的业绩明显下了一个台阶。在2020年之前,量化投资实现20%到30%的超额收益都是稀松平常,但是近年来市场上的量化产品超额收益普遍下滑。据业内机构统计,一些头部机构管理下的明星产品,2020年以前的超额收益在20%以上,但是最近三年的超额收益均在10%以下,今年甚至低于5%。
据徐伟的观察,往年超额收益在30%以下的产品都很难卖出去,这两年要是有10%的超额,都能卖得很好。
因此,在越来越“卷”的量化江湖,更优的策略、更好的硬件、更强的算力、引入新的数据源成为当下量化投资机构的竞争焦点。而在当下,这系列的竞争都指向AI模型的竞争,特别是幻方在DeepSeek上的成功,可以说直接打响了量化机构的“AI军备竞赛”。
公开信息显示,今年以来多家知名量化机构布局AI模型,比如宽德投资在2月底宣布招聘智能学习实验室人才,该实验室专注于研发通用性超级科技助手;鸣石基金建立亿元级超算中心支持“创世纪AI实验室”,招募全球科学家开发金融垂直模型;九坤投资设立Data Lab与AI Lab,通过自然语言处理解析非结构化数据。
不过,虽然量化机构在AI领域的竞争日益激烈,但是研发投入主要集中在金融投资垂类的应用模型方面,而不是像幻方投资那样集中精力于大模型的基础研究。
“我们对自己的定位不是造轮子的人,而是把更多的精力聚焦在如何在投资领域更好地利用AI。”赵雨这样说。
那么,AI领域的竞争会带来行业马太效应,即强者恒强、中腰部机构出局的现象?对此,多家机构负责人都给出了否定的回答。
比如,李涛就表示,AI的发展还没有对投资效果带来翻天覆地的变化,以后如果仅仅因为AI也不会形成行业的马太效应,一是因为即便中小机构无法搭建自己的超算中心,但是现在云服务非常普遍,以租用的方式使用算力,也可以满足算力需求;第二,当前监管对高频交易进行限制,中低频领域是不需要过多地卷算力、算法的,即使算力很强,也不一定能形成较高的壁垒;第三,所有的量化机构都会随着规模的增长,超额收益会逐步下降。量化领域的规模和超额是对立的概念,规模扩大后,超额必然会下降。在量化投资中,存在一个规模红利期,就是一个策略在某个规模下性价比会最高,这个规模并不是越大越好。
赵雨也认为,AI大模型确实可能加速行业的资源整合,但更倾向于将其视为生态重构而非简单的两极分化。
至于DeepSeek的成功会不会反哺幻方提升投资能力从而形成更强大的护城河,一位业内人士笑谈,“现在梁老板的重心都不在投资上了,我们更没必要担心了。”
2025-04-28 07:00:01
文/腾讯新闻科技主笔 张小珺
编辑/马龙
人类驯服可控核聚变还有多少路程?
2021年,Sam Altman以个人名义向美国核聚变初创公司Helion Energy注资3.75亿美金,这是他迄今最大一笔个人下注。Helion豪言称,将在2028年前建成全球首座50兆瓦聚变电厂。
马斯克持不同看法。他曾说:“我们的头顶一直就有一个取之不尽、用之不竭的核聚变反应堆——太阳”。他相信太阳能才是人类能源问题的根本路径。
不过,在很多人眼中,可控核聚变仍然是“能源界的圣杯”。随着今天我们向AGI迈进,能源将是文明演进的最大瓶颈——毕竟,AGI或许不惧怕人类,但一定害怕断电。
2025年4月,我访谈了中国可控核聚变创业公司、能量奇点创始人兼CEO杨钊。相比AI,可控核聚变是一条更漫长、更人迹罕至的创业之路。
它几乎是面对人类有史以来最复杂的物理难题之一,站在科技与人类文明的边界上,做技术摸索。
作为中国可控核聚变事业的参与者,他也相对清晰地计算出了,人类驯服可控核聚变还需要多少资金要消耗?还有多少路程要走?我们也探讨了,在更远处的未来,当能源成为无限,我们的世界、我们的文明又将怎样?
“托卡马克核心想法是,
磁场长得像一个甜甜圈”
张小珺:我们先从一些比较高频出现且很重要的词汇开始聊起,给大家做一个重点的科普扫盲。
什么是核裂变,什么是核聚变,区别是什么?
杨钊:他们都属于核能。核能基本想法是通过核反应,使反应产物的总质量小于反应的原料总质量,这样,质量差距最终带来的,根据爱因斯坦能量方程,变成能量释放出来。
只不过裂变和聚变区别在于:裂变使用的是较重原子核,通过原子核分裂成几个较轻原子核,这个反应过程使最终产物的反应总质量低于原来较重的原子核的过程。
裂变使用的原料放射性比较强,且原子序数比较大的元素;而聚变相反,使用单个质量较轻的原子核,一般两个左右,让它们相互碰撞,融合成一个质量较重的原子核,但最终反应产物总质量比反应前的几个原子核总质量加起来要小。这个过程也是把质量变成能量的过程。
裂变是原子弹原理,而聚变对应的是氢弹原理。
张小珺:接下来解释两个词,一个是“托卡马克”,一个是“高温超导托卡马克”。
杨钊:托卡马克是属于实现可控核聚变技术路线中的一种。
实现可控核聚变大体分三个路线:大家最常见的一个可控核聚变,是太阳、恒星,恒星靠重力将大量原子聚集,使密度足够高,最终产生了聚变反应,它不停在释放能量。
地球上没办法产生这么大重力,这条路线肯定走不通。人类使用了两种方法:一个叫磁约束,一个叫惯性约束。在这个分支内,托卡马克是属于磁约束的这么一个大的范畴。
磁约束的核心想法是通过产生一个特定位形磁场,将反应温度非常高的等离子体约束在磁场中,不要让它跟其他固体设备产生直接接触。
但是磁场到底长成什么样,这是在磁约束下面的不同分支的区别了。
现在研究最为广泛,从拿到的实验结果上来说,参数最高,并且已经达到可以作为接近能量盈亏平衡的技术路线,是托卡马克。最开始苏联提出来的一套技术路线。
托卡马克核心想法是,磁场长得像一个甜甜圈,这个甜甜圈因为是一个圆环,封闭的,所以用这样的磁场位形去将高温等离子体约束在甜甜圈内。我们通过提高等离子体温度,并且有磁场不断去约束这个等离子体,让整个高温等离子体,在我设计的甜甜圈范围内发生这种碰撞,产生聚变,释放能量。
当然了,它除了有一个环向甜甜圈方向的磁场之外,还有一个环向电流,这是非常关键的组成部分。具备有这种环向磁场,且有环向电流的二维轴对称的磁场位形,我们把它命名为“托卡马克”。
张小珺:高温超导托卡马克?
杨钊:刚刚说了托卡马克需要很强磁场,这个磁场用来约束等离子体,怎么去产生这样一个磁场,做法就是我们通过造一个磁体,这个磁体里通过很大电流,产生磁场。用来做磁体的材料是什么样子,这就又出现了几代托卡马克了。
磁体是对于托卡马克或者对于磁约束来说,最关键的一个系统部件,它的核心材料变化会影响到整个装置其他所有子系统的设计和它的对接。
托卡马克大概经历了三个阶段:
最早,大家只是为了做一个实验看看性能,绝大部分早期托卡马克都是用铜做的磁体。铜作为一个常规导体,它会在运行过程中,因为你通了很大电流,会发热。所以当参数比较高的时候,大家发现用铜导体做的托卡马克并不能很长时间运行,大概秒级、十几秒级量级,就必须得关掉,否则铜自身发热就会造成磁体本身甚至会被熔化掉。所以它只能是短时间脉冲做一个短脉冲实验。
因为铜这个东西是可以在室温下,当然也可以降温做,但它大部分是水冷的降温方式,所以铜导体的装置,工程复杂度相对较低,并不需要营造出一个真空且很低温环境才能运行相比于超导装置。这也是为什么早期我们为了去探索等离子体性能,在工程上先用最简单方法,就是先用铜去做这样的装置,短时间拿到实验结果。
等到后面,参数越来越高,且我们要考虑未来真正做聚变商业化,你不可能用铜再去做装置,否则它的运行时间不够,而且铜自身消耗的能量比你发出的能量还要大。
所以人们开始思考,我用超导材料去做磁体。这个也经历过一部分磁体用超导材料,一部分磁体用铜,但第一个集大成者的是我们合肥EAST装置。它是第一个全低温超导的一台托卡马克。意思就是,所有磁体线圈都是用低温超导这种材料去做的完整的托卡马克。
为了做一台超导托卡马克,你就需要去营造一个高真空环境,让磁体在这个真空中去运行,否则,光空间的漏热、热对流、热传导已经没办法产生磁体能运行在零下269度极低温的环境。同时,你为了防止热辐射,会造冷屏,就是低温的用来减少热辐射包裹在磁体外部的环境。所以,一台低温超导托卡马克,工程复杂性很高。
这也是为什么在大概2000年之后才建成一台装置,像EAST是2002年开建,大概2006、2007年建成的。
后面,韩国还有一台装置叫KSTAR,是一台低温超导的装置;再往后像日本最近建成了一台新的,很高参数的装置叫JT-60SA,也是一台低温超导的装置。
全世界全低温超导的装置就这三台。
低温超导虽然可以在很低的温度下长时间运行。比如说我们可以看到有一些1000秒这样的运行记录。但它的一个大问题在于,如果我用这条技术路线做一台可以商业化发电的装置,一个核心参数就是我需要有足够多输出能量,输出能量要远高于消耗的能量,这是发电装置。
大概尺寸就是现在正建设的法国这台装置ITER,这台装置由欧盟牵头,中国、美国等加起来6个国家一起参与的,已经投入资金250亿欧元的一台装置。
张小珺:这个项目历时很长。
杨钊:它的设计是在90年代完成的,真正开建是2006年,现在最新消息已经延期到2034年——大概建设周期就是30年的装置——因为它非常大。
这就说到低温超导的弊端。用这种材料去做的一台托卡马克,由于这种低温超导材料的磁场有限制,不能太高,否则就会变成像铜一样的东西,就有电阻,不能长时间运行。就使得这个装置必须做得非常大,才能做到足够大能量增益,结果是它的建造周期会特别长,成本会极高,甚至这个东西做出来,度电成本可能是火电的100倍以上。
它是一个科学研究装置。如果你的目标是比火电成本低,甚至未来远低,这条技术路线难度挑战是非常大的,怎么把成本从100倍,两个数量级以上降下来。
所以在2018年之后有这么一个新想法。我们用一种新的超导材料,这也是在2015年之后,2018年左右才在工程上、工业上实现量产的叫高温超导材料。
这种新材料好处在于,在低温下运行的时候,临界磁场强度是比低温超导会高很多,可以高一倍以上,至少一倍。高磁场带来的好处,在同样性能情况下,比如说同样能量增益的条件下,我可以将装置体积缩小两个数量级,也意味着你的建造成本大约缩小两个数量级。因为对于任何一台非标设备来说,你的质量或体积决定了成本。
这是用高温超导这个材料相比于低温超导来说,它们都是超导,而且运行的温度区别不大,大概是4K到10K、20K区别,零下269度到零下259度这样。
张小珺:高温超导和低温超导都是低温。
杨钊:温度都很低。但它的临界磁场强度完全不一样。
通过显著去提升磁场强度,去显著缩小装置的尺寸,我们得到的好处是我最终这台装置的造价,换句话,我用聚变发出的度电成本就可以显著降低,最终达到可能跟火电差不多,甚至未来规模化生产的时候,是火电一个数量级以下的成本。
张小珺:高温超导为什么可以成本更低,体积更小?
杨钊:这是在过去六七十年聚变的研究过程中,大家通过上百台装置,上千次实验总结出来的规律——我为了达到一个足够高的能量增益——所谓能量增益就是我的输出功率除以输入功率,就是我产生的能量除以我消耗的能量叫做能量增益。
张小珺:是break even的那个关键指标?
杨钊:对。如果等于1就是break even,你要做电站就要远大于1,比如说等于10,就是你的输出能量功率是输入的10倍,毕竟你在真正的运行过程中会有损耗。
能量增益,它实际上是被物理上的参数叫作“三乘积”所决定的。它的等离子体的密度×温度×约束时间,这三个数一乘,所以叫三乘积。
这三个数一乘之后,在一个相对非常复杂的单位下,达到10的21次方。物理学第一性原理告诉你,无论你用什么手段去实现,用氘和氚作为原料,当这个三乘积到10的21次方,大概就是Q在1,当然你再稍微高一点点就是21到22次方这个数量级以内,能量增益Q就从1甚至到无穷,可以长得非常快,类似雪崩一样。一旦过了break even的线,就会往上提一点点参数,能量增益就会提得很高。
这个逻辑告诉我们什么?如果你想提高能量增益,你就是提高三乘积就行,因为三乘积会决定能量增益。三乘积在过去六七十年的研究里面,大家发现工程上最有效去提升三乘积的方法实际上要么你把装置做得足够大,要么你把磁场做得足够强,就这两条手段。
张小珺:它是温度、密度和能量约束时间的乘积,那不是应该改变这三个数值中的一个?
杨钊:这三个数值不能直接改变,相当于是一个以装置性能决定的一些结果。
张小珺:装置更大能改变哪个数值?
杨钊:它都会有影响。三乘积一个很典型的特点,你单纯提升任何一个参数,大概率剩下两个参数都会往下掉,而且导致你的装置三乘积总性能往下掉,所以你的优化实际上优化的是这个乘积结果,这个乘积的结果会跟一台装置的很多很多参数都相关,它比较复杂。
我们并没有一个很好的第一性原理推导出来它到底跟啥相关。最终的做法就是通过上千次的实验,我们去拟合出来这样一个定标率。
张小珺:还有一个关键词叫“Q值”,就是能量增益。如果它是1,就break even了。一般有两个关键指标,一个是大于1,一个是大于10。
杨钊:对,大于1是一个基本点,否则你小于1,必定是个耗电装置。
但你刚刚大于1,也是耗电装置,毕竟你能量转化的过程中还是会有损耗。
一台聚变电站它根据你电站的规模和大小不一样,设计范围大概是在Q=5到Q=30这个区间内,你完全能够把一台聚变电站设计出来。
远大于1,一般就是大一个数量级,大家就把这个工程可行性一般的标准就定到了Q=10上。
张小珺:现在全球能做最高的水平是Q等于多少?
杨钊:在磁约束,最高纪录是托卡马克拿到的,这是在90年代从氘氚等效,并没有用氚直接做实验,我是用氘氘的原料做实验,但因为在物理学上有一个大家都公认的方法就是:假设,我知道了这次实验的等离子体的性质,我又假设,这次实验里面一半是氘、一半是氚,而并不都是氚,因为唯一区别就是碰撞过程中发出的能量,它的散射截面会不一样,这是一个很微观的物理学测得很精准的东西。
它可以通过一个氘氘的实验结果,推算出,假如变成了50%、50%的氘氚,Q值是多少。
氘氚等效最高实验记录是日本在JT-60(U)这台装置上做到Q=1.25。
张小珺:是比较低的。
杨钊:刚刚过1。
前两年,时间不长,用惯性约束这条技术路线,就拿激光去打一个氘氚靶,这个Q做到过1.5,当然这是直接有氘有氚的一个靶核。所以这是真正的氘氚实验上最高记录是惯性约束这边在美国的NIF这台装置上实现Q=1.5。
全世界范围做到三乘积21次方,21次方数量级的托卡马克其实大概有三四台,刚刚说的日本JT-60(U),美国有TFTR和DIII-D,英国还有一台JET,几台装置都接近10的21次方。
也是因为在90年代,我们有了托卡马克非常高参数接近于break even或者Q=1.25已经超过break even实验参数。
全世界范围内说下一台我们做一台Q>10的,也就有了ITER计划。
“我们不是科学研究,不是武器研究,
而是为了发电”
张小珺:接下来介绍一下可控核聚变演变的历史。
杨钊:最开始我们介绍了核反应的基本过程,总之是用反应后的质量的减少转化成能量,就是爱因斯坦的质能方程,去释放能量的一个过程。
聚变最开始大家是做氢弹,70多年前,我们第一次掌握了核聚变的能量,就是第一个氢弹的爆炸。当氢弹爆炸了之后,人们就在想我怎么样能够去把氢弹这种武器级别的、不受控的,炸了能量就释放出来的这么个状态,变成基于我们的设计要求,比如我这个时候想要500兆瓦的电输入,就能放出500兆瓦。如果说1G瓦的电输出就能放到1G瓦,根据我的设计要求去释放能量这种可控状态。
这个过程已经持续了70年左右的周期了。
张小珺:爱因斯坦相对论中重要的方程是质能方程:E=MC²。
杨钊:质能方程说的是,一个东西它有质量就意味着它本身是储存着能量。
对于核反应,你可以看到的是反应前有一堆原子核,反应后变成了另外一些原子核,但我们会发现,如果这个反应过程中,它反应后的所有产物的质量加起来,假设它比反应前的所有反应物的质量加起来要小,根据质能方程,我们知道质量小了,能量总是要守恒,就会变成反应后产物的动能。这就是通过核反应去产生能量的过程。
因为反应前加起来比较重,反应后加起来比较轻,但为了能量守恒,反应后的这些轻原子核需要最终以动能形式把这个能量去守恒,这个反应过程相当于初始两个没什么能量的东西撞了之后变成新的产物,且每一个产物都携带大量动能——这个是爱因斯坦的质能方程。
张小珺:质量和能量可以相互转换。
杨钊:非常小的一个质量损失就会产生巨大的能量。
接下来就是从人们掌握了氢弹技术之后,就在思考怎么做到可控核聚变这个事。
在地球上要不然用惯性约束去做可控核聚变,要不然用磁约束。实际上惯性约束,包括美国做到Q=1.5的NIF装置,包括国内对标的就是中国工程物理研究院(业界称之为九院)的神光这台装置,本质上都是在做全球禁核的条件下的一些先进核武器研究,包括你看美国NIF官网上也是这么写的。
因为这套方法,就不太适合民用,需要用非常多激光,非常短时间内,同频照射在靶核上,压缩靶核产生一个反应。它没有办法稳态做这个实验。我们也知道,把电能转化成激光能量,这一步折损非常大,能量转化3%都不到。
虽然我们看的这个Q是1.5,聚变输出能量除以输入,但输入的实际上是激光的能量,并没有算怎么端到端从电转化到激光这一步是不考虑的。
这两个原因吧:一个是没有办法稳定运行,只能短时间脉冲运行;第二,激光的转化效率极低。所以大家在做惯性约束的时候,没有把它去当民用,当发电的路线在做,它就是一个研究高效率核武器的方法。
张小珺:它能够有多长时间持续?
杨钊:一个反应大概是纳秒级别,10的负9次方秒,这是一个反应过程。
张小珺:它有什么优点吗?惯性约束。
杨钊:从需求上来说,比如说早期核武器,氢弹燃烧效率是很低的。
什么意思?我有一大块可以用来去反应的原料,但发生了这个核反应,通过爱因斯坦的质能方程真正释放能量的那一部分的比例很小,大部分的原料不会参与反应,达不到反应条件或者反应就终止了。
惯性约束一个方法就是我怎么样能不能,原来1%、2%的反应比例,我提到80%,甚至提到更高,我就可以充分实现这个核反应,用最小原料释放出来最多能量,这些都是惯性约束可以去研究的一些问题。包括在这种短时间内,高温高压的条件下聚变反应过程中,它到底经历什么样的过程,能够提升反应效率,这些都是惯性约束,在这样一个受控环境下去研究的问题。
好处是相比氢弹来说,它是一个更可控、更可测、更方便研究的反应环境。
如果我们最终目的不是科学研究,不是武器研究,而是为了做发电,主要方法就是磁约束的方法了。
磁约束我刚才也介绍了,不同磁场形状对应不同磁约束下面的分叉的技术路线,而在磁约束的众多技术路线里,托卡马克其实是在三乘积,我们刚才说的决定能量增益的物理参数做得最高,而且高于其他技术路线大概至少两个数量级左右,甚至到四个数量级。
在上个世纪60年代左右,苏联这边就想到用甜甜圈一样的磁场位形托卡马克这个路线,并且他们造出来第一台装置就发现性能非常好,比其他之前正在同步研究的技术路线的性能都要高很多。
大概从上世纪六七十年代开始,全世界范围都把主要的精力投入到托卡马克的原因,它的性能看起来要比其他的技术路线都要好,都要高。
张小珺:这个技术路线是全球都共识过的技术路线?
杨钊:对。你像中国之前两个大的科研院所——等离子所、585——过去建的这些大装置全部都是托卡马克。美国几台高参数装置也都是托卡马克。包括为什么全世界最大的装置ITER也是一台托卡马克。就是因为它具有最多的人在研究,有最多实验结果,而且在实验上真正做到过接近21次方的实验参数。
张小珺:全球大概有多少台托卡马克?
杨钊:100台以上。
人们在不断去建更高参数的托卡马克,不断拿到更好的结果,就吸引到了更多资金。一步一步地,就像我刚才说到上世纪90年代,全世界有三台甚至到四台的时候,托卡马克已经做到21次方了,就产生了ITER计划。
在这个过程中,也就经历了从早期大家只是为了验证这个磁场位形对于等离子体约束好不好,所以用最简单的工程方法,就是用铜去做托卡马克,这是最早期,甚至绝大部分的托卡马克都是用铜做的。
再往后是到2006年左右,像中国EAST这台装置,就是全世界第一台低温超导的托卡马克装置,从铜的托卡马克的时代就过渡到了用超导去做托卡马克,因为你未来要真正发电的话一定是超导装置,它的发热小,能够长时间运行。
再到我们刚刚说2018年左右,第二代高温超导的材料可以工程化量产了之后,美国最开始MIT和CFS(Commonwealth Fusion Systems,美国麻省理工学院分拆出来的联邦核聚变系统公司)公司一起就提出了一台SPARC装置,它的目标是和ITER性能一样,磁场提高一倍,体积缩小到2%到3%,成本大概也是从250亿欧元降到10亿美金。
这就大体来说聚变,尤其是磁约束托卡马克的发展历史,就是这么一个过程。
到了去年,也就是2024年,包括到现在为止,高温超导托卡马克这条技术路线实际上一直是一个想法,直到去年我们建成了全世界第一台全高温超导托卡马克,就是这个“洪荒70”这台装置。
第一次在工程上,在一个完整装置级别,去验证了高温超导托卡马克这个事不只是一个概念,它可以在工程上建出来,也可以真正实验运行,且运行参数稳定。
类似于假设曾经所有船都是用木头造的,当然最开始是美国,后来我们在国内最早提出,我们说如果你要建一艘真正的高性能航母,你一定需要用钢作为原材料,但是没有人用钢造过船。
“洪荒70”就相当于是全世界第一艘,用这个类比,第一艘用钢做的完整的船。
它的挑战是啥?当你换了这个主体材料之后,你用木头的时候,是不会思考焊接工艺,不会思考除锈的问题,而且木头本身就能漂在水上,钢放在水上就沉了。虽然船都是阿基米德原理、浮力原理,排水量足够大,总是可以浮起来的。但当你把主体材料换了,整个船的设计,整个加工工艺,全部都变了,并且在真正下水且运行之前,没有人可以100%确定它下水之后船不会漏水,不会沉下去。
这就是我们做70这台装置,它不是性能很高,但它是第一艘用新材料建造的完整装置。证明了这种新材料去建一台完整装置工程是可行的,并且我让它下水,让它往前去走,然后开回来,正常运行它是稳定的,所有系统接口都是通畅的。
张小珺:你们验证了体积可以更小,成本可以更低没有?
杨钊:坦率说没有。这件事是需要在我们下一台装置“洪荒170”去验证,因为你要谈体积更小、成本更低,你需要满足相同的性能。
比如说我需要跟ITER的参数一样,做到Q>10的情况下,我们去对比成本和体积,这就是下一台装置目标。
“我们的目标是将聚变的度电成本
降到跟火电一样甚至更低”
张小珺:为什么在2021年决定创业?要用创业的形式来做?
杨钊:在2021年这个时间点,第一个判断是到底聚变发展到什么程度了?
一个基本结论是在那个时间点,如果人类不计成本去用聚变发电,肯定做得到。比如ITER这样一台装置,它就是建造周期长,但设计、很多事情都是90年代定稿,它是非常保守、非常传统的这些物理去做的设计。
张小珺:它做得出来吗?
杨钊:如果不犯一些工程上的低级错误,把它做出来肯定是会发生的,只不过它需要花多长时间和花多少钱问题。
它也是全世界从国际联合项目上来说,应该是第二贵的项目了。
张小珺:第一贵是什么?
杨钊:国际空间站。当你的资金规模到了上百亿,好几百亿欧元或美元,类似千亿人民币规模,这种国际联合的方式就是一种可能可行的方法。
当然最开始,实际上90年代大家已经看到聚变做到Q>1,10的21次方参数做出来几台。最开始是苏联和美国提出来的ITER计划,两个当时的强国去说,我们能不能一起去做出来一个真正对于工程上来说有意义Q>10的装置。这就是90年代最开始提出来的ITER计划。
后来,苏联解体了,这个项目由欧盟主导了,装置也落在法国。
最开始是苏联、美国提出这个项目,后来欧盟主导,中国、美国还有其他四个国家加起来一起参与的这个项目,一直推进到现在。
张小珺:会不会造出来发现过时了?
杨钊:这是一个现在的情况,它确实是由于时间、工期过长,导致你看现在可能真正的一台Q>10的装置人们认为最早可能就是美国的那台高温超导的SPARC装置,2022年开建,到2026年,他们对外宣称是明年就能建成。
回到最开始的问题,2021年,当时最基本判断就是,聚变这件事其实从科学的可行性,甚至说如果我不计成本的话,从工程的可行性来说,是有比较扎实的基础和经验积累的。
到底聚变商业化这件事我们缺啥?我们需要啥?核心就是我们需要将聚变度电成本降下来。
换句话说什么叫做聚变商业化,这个在团队里面也非常清楚:你哪天把度电成本降到跟火电一样了,你就商业化了;哪天你把度电成本降到比火电低一个数量级了,你基本上就可以提供一个数量级甚至两个数量级以上的能源,这就是所谓的能源自由的一个状态。
金标准就是你的度电成本。
这件事,我们2021年一个看法是,也许高温超导这样一条技术路线可以显著缩小装置体积,将成本两个数量级降低,让我们觉得是可以干的。
张小珺:是工程化的拐点?
杨钊:是,由于新材料变革导致了成本,比如说火电两个数量级以上降到跟火电差不多。像这种,你差量级的成本的区别,你用渐进式的——今天降个10%,明天降个20%的方法,甚至能不能过去都不一定,非常漫长。往往真正变革就是有一些材料的变革或者新的技术的变革导致数量级在缩小,你再规模化,再把它降一个数量级,那是另一件事。
在2021年,就觉得这件事情,我们的目标是要将聚变度电成本降到跟火电一样甚至更低,我们这个公司提供的价值就是在最终聚变发电这个技术过程中,所有能够持续去提高性价比,降低聚变度电成本的事,就是我们都要去做的事情。
这是为什么我们最开始装置整体设计一定是自己做的,装置磁体从设计、加工到最终测试、运行,我们都要自己做,这都是显著核心影响你装置成本的东西。包括后面,我们基本上核心的子系统全部都自研了。
从提高性价比来说,设计变更一点点,成本区别会非常大。你的核心子系统,因为它会影响其他所有系统接口,它的设计变更一点点,整个装置变化也是非常大的,而且如果我能够将我的成本都变成原材料成本,所有的知识和信息是由我团队自己摸索出来,我就可以真正将一台装置的成本降到,有可能,你越往上推它的原材料成本越低。
这是我们当时决定设计上完全自己去干,核心子系统自己去设计加工,自己去产出,包括最终调试、运行,因为只有你把这台装置对你来说变成完全不是黑盒,所有东西透明,你才知道我有一个新的目标,比如说达到一个更高参数的情况,我去优化它成本的时候,我要调什么系统,每个系统最优值在哪里。
2021年我们想清楚了这件事情,也就搭起来了,最开始就4个人。
张小珺:为什么以创业公司的方式去做?不用高校的方式。
杨钊:我们现在要解决的问题是用最短的时间、最小成本实现整个聚变性价比飞速的量级的变化。这件事本质就是一家创业公司适合干的事。
从一个组织属性上来说,最短决策流程,最高效办事方法,将一个东西从实验室推到真正低成本大规模使用的过程,这是创业公司最擅长做的事,而不是高校或者科研院所最擅长做的事情。
张小珺:能不能讲讲你的背景?
杨钊:我是学物理科班出身的。北大物理系,博士在斯坦福做理论物理的方向。
我做的是比较底层的物理,是做量子引力,做弦论,包括量子引力和量子信息的交叉,离这个世界比较远的一些基础物理。大概在博士期间,在斯坦福主要做的都是这些非常基础物理研究。
张小珺:什么时候你想做可控核聚变?
杨钊:最早想在本科阶段,我们学物理,对于各个分支基础物理研究是有一些概念的。当时确实想过,到底学物理对于未来人类生活和发展什么东西有比较重大影响?
在当时,认知甚至到现在,对于未来一定会发生且影响最大的一件事,就是聚变。十年的尺度上,我们是觉得聚变可能在物理学对于人类整个文明来说,它影响最大的一件事。
对我个人来说,我比较喜欢,包括我当年做物理研究也是,比较喜欢做的一类事:这类事情无论是不是我做,早晚会有人做,所谓历史必然会发展的这么一个趋势,这类事情对我来说是吸引力最大的一件事。
这件事里面,通过聚变改变能源的供给结构,甚至我可以提供比当前数量级以上更高能量的一件事情,这件事对整个人类的发展是一个巨大变革,可能我想不到更大变革的事情了。甚至这件事做成之后,通过驯服聚变能,用来做无工质太空旅行的发动机,而不是现在的化学火箭,才是真正有意义的行星际的商业航天。
这件事情它无论从能源供给还是从动力的角度,都是对于人类发展来说巨大的一个变化。
当时就属于“有生之年系列”,本科就觉得这辈子早晚如果有可能的话,参与到这件事里面去。
张小珺:全球现在science领域的“明珠”有哪几颗?
杨钊:又难倒我了(笑),我想想。
非常多,在科学领域这样的问题非常多,因为我是做基础理论,人们对于引力的量子描述,真正微观尺度下,引力到底是一个什么样的行为,而不是一个经典理论,从爱因斯坦开始就已经在研究,到现在也没有完全把这件事搞清楚。
包括宇宙学上的暗物质,使宇宙膨胀的暗能量是啥也不是很清楚。
有非常多基础物理问题,大家很希望能理解,但我们至少现在,无论是理论还是实验这个认知都达不到这个水平。
再具象一些,大家在不停研究新的材料,这个就多了去了。我们现在大家都觉得很习惯像手机、半导体,也就是在七八十年代那个时候当时最前沿做固体物理的,做半导体理论的这些人,发现材料预测了之后,经过几十年工程化,变成芯片。现在大量的,比如凝聚态物理学家或者固体物理学家,他们在研究的很多新材料,很前沿的材料,在未来慢慢都会变成我们日常生活中应用的物件。
张小珺:你是2017年博士毕业,后来你在干吗?
杨钊:2017-2018年在美国待了一年,那个时候只是觉得早晚要做成像聚变这种事,你还是要通过创业的方式去实现的。但刚毕业也不知道该干啥,是实话,我有一年的时间在思考,如果我去做一个创业的一个公司,我第一次要做什么事情。
2018年底回国之后是金沙江投了我们那个公司。
张小珺:先在金沙江创投做EIR(入驻企业家)吧?
杨钊:对,到2018年底出来之后当时做了一家人工智能和音乐教育结合的一家公司。
我的物理研究方向弦论,直接做弦论相关的创业项目也确实找不到。我毕竟是技术出身,从技术方向去推到应用上就找了和音乐教育的契合点,这个公司大概做了三年吧。到2021年,经历了在线教育非常快速变化的周期。
从2021年就在思考到底聚变能不能在现在这个时间点开始去做,如果不能原因是啥,我还需要推动的东西是啥,如果能,为什么不从现在开始去做?
张小珺:2021年初,你们一起拜访了很多科研院所和供应商,调研的过程怎么样,得出行业结论没有?
杨钊:最开始调研,我们想理解的是,如果我们在国内推动可控核聚变,我会不会被人才、技术和原料这三个东西卡住脖子?
调研下来的结果是原料,包括供应商,这些核心你可能会用到的供应商,基本不太存在卡脖子现象。从我们选择高温超导这条技术路线,我们不会的,大概率全世界范围内大家也不会,都是很新的。
传统的,已经积累的这些知识大部分是学术公开的,从技术本身的话,并不太存在被卡脖子卡住的事。
人才上,更不存在这个问题,尤其是这件事的核心,一方面是有研究的事情,但更重要的是工程化落地。中国在工程师的团队里面,确实是有红利的。
基本判断就是,在那个时间点,没有一个no go。没有什么东西是说你不能现在开始去做的,这个东西它是一个正向循环很快速的东西,它是有大量的在你做它的过程中,积累出来的经验和知识,能够迭代到下一代产品里面的东西。
它不是一个有关键点,这个关键点你做到了,或者别人用这个关键点都能做到——不是的。
它是有大量的很细碎的问题,每一个问题都是需要一个一个去解决的爱迪生式的问题。而且它本来的初始投入量,资金量也比较大。它是一个先手优势很强的这么一个行业。
人才是稀缺的,换句话说可能就没有,就全部自己培养;知识是自己积累的,且正向循环是非常快的。每一代资金量都是比较大的,作为一个创业公司来说。当你有了领先优势之后,同样方向的第二名就基本上,我的先手优势过大了。
赶早不赶晚。
“聚变装置里面反应的过程就是一个
充满了能量且无序的状态”
张小珺:你们第一代产品“洪荒70”是怎么建造的,为什么叫“洪荒”?
杨钊:洪荒在中国神话里面是一个非常早期、能量非常充沛的一个状态。当然了,这个状态是一个非常混沌的状态,它有很多的能量,一个非常无序的状态。
聚变在做的也是这样一个事情。你把很多原来很无序的东西,核能把它转变成电能。这台装置里面反应的过程就是一个充满了能量,且非常无序的状态,我们把这一系列通通命名为“洪荒”。
70是它关键参数,大半径的参数,70个厘米,就叫70。
张小珺:第一代产品怎么构造出来的,它的意义是什么?构造出一台装置到底是一个什么样的过程,多少人?
杨钊:最开始就4个创始人,到这台装置建成大概是一百人团队,两年时间。
站在现在这个时间点,一台装置设计大概会经过哪些过程?
首先先做物理设计,你这台装置希望实现的最核心目标是啥,基于这个目标会变成一些我的等离子体状态,这就是我要达成这个目标,最核心的物理参数,它需要实现到什么状态,这就是几个物理设计。
基于这个物理设计,等离子体要达到这样的性能,下一件事就是概念设计,你的每一个子系统都需要去实现什么样的参数才能够让最终的物理参数达到你刚刚的物理设计的目标,比如说你的磁场要多大,磁场的形状变成什么样子,你把等离子体它在真空环境里,真空环境真空室的结构长什么样,各个子系统的运行温度是什么样子,包括外围什么时候往里面加料,充气,什么时候去诊断,去看当前的运行状态,什么时候做控制等等。
基于你要实现的物理参数的目标,你会把每一个子系统的核心目标设计出来,它的运行工况要设计出来,它和其他子系统之间的接口要设计出来。
否则,每个子系统互相打架就拼不起来。
张小珺:有多少子系统?
杨钊:一级子系统我们粗分的话大概10个。二级子系统,大概30多个。
在做完概念设计,至少为了达成我们最大目标,转化成这个物理目标,每一套系统都有一个设计概念,可行性大概是这个东西能做出来。
做到这一步之后再往下一步叫工程设计。我要一个多大流量,多少温度,多少流速的一套低温系统,你的工程上怎么把它实现出来。低温系统里面有什么分配阀箱、液氦储罐、制冷机,工程设备全部都设计出来了。到这一步,有了每个系统的概念之后,把它要设计成真正可以用来制造、加工或者我选型买设备的一套工程设计方案。出图纸,出技术需求。这就是第三步的工程设计。
完成工程设计之后,就进入到了加工制造阶段,有一些我们把图纸给到外面机加或者制造的供应商,焊接的供应商,大的罐罐、真空压力容器,让它们去制造,返给我们,有一些比如说磁体,我们去另一个厂房自己制造加工。
张小珺:磁体自己制造?
杨钊:对,你买钢,买树脂,买高温超导的带材,自己加工成你设计的那个样子的磁体,最终交付到装置的安装现场去。
不同的子系统现在开始去进入加工状态,按照我们设计的方案,把它全部加工出来。加工完了子系统就到验收状态,每个子系统是不是在子系统级别可以满足你的设计指标?如果可以,就验收,不可以,该修的修,该返工的返工。
子系统验收完了之后就开始进入总体装配状态,我们要把不同子系统安装起来,变成一台完整托卡马克,就是你看到的我现在的这台装置。装配过程中,还有测试,装完之后就是联调我的整个系统,装完之后整体能不能按照我的设计要求去运行在我的设计参数内,如果联调全部通过,就到了最终实验运行状态,我就要朝着我最开始设计目标,能不能实现它,等离子体能不能点亮。
我们今年就希望能做到千秒级别的稳态运行,能不能做到?
从最开始的设计到一步一步的细化设计,到制造,到装配,到最终运行,其实就是验收过程。你到底建完的东西有没有达到你最开始的设计目标,它就完成了整个过程了。
在这个过程中,每一个环节它需要的能力也都不一样。
前面的设计阶段,基本上我们的做法就是从需求出发,读文献、看教科书,从最基础的公式开始推起来,定出来核心的最重要的参数,再基于这个参数在外面去细化,一步步细化,去做工程仿真,比如设计出来的结构——力,能不能在各种工况下满足材料的要求?受热能不能散热散出去?电磁学的性能磁场给你的设计是不是一样的?大量的工程仿真。
对于一些东西,参数上仿真上算不准,就做工艺实验。比如大的件很大,先做一个小样,这个小样,你的仿真和实验参数是不是有可比性?是不是在10%、20%预测范围内?相信这个实验和仿真对照之后,我就相信仿真模型,我再给它往外推,我再做更大件。
这个过程中,不断通过读文献,通过仿真,通过实验和仿真的对比,去相信这套模型,再去往真正的子系统去造,造这个完整的磁体。
张小珺:这个过程顺吗?
杨钊:肯定不顺。中间有非常多的,你每个环节都在不断出问题,而且你越接近实物状态,你的问题越大,问题越多,改动去修补的成本越高。
张小珺:工程中遇到最难解决的几个问题是什么?
杨钊:每天都是一大堆的问题。
最难的实际上是不知道什么出了问题,当你遇到一个问题的时候,分析问题,由于很多东西你不能直接测,你不可测,去猜测这个问题的原因这件事是比较费劲的,也是比较折磨人的。
张小珺:解决最长时间的是什么?
杨钊:我们一台托卡马克装置的环向场磁体有12个,我们在造第一个全尺寸工艺件的时候,如果造好了可能就是第一个正式件了。
前面的工序都很顺利,因为我们每一道工序之后都会做质检,判断这道工序前后性能有没有变化,是不是符合预期,都很顺利。
但到最后一道工序的时候,就发现性能有所下降,比我们预期的要下降得不少。
这个东西到底能不能真正成为一个正式件去上装置,它性能虽然有下降,但还是一个比较好的性能。到底是什么原因,这道工序里面哪一道原因造成,因为最后一道工序看起来也没有特别复杂的事情,结果就是有性能衰减。
这个时候,当时分析来分析去,找各种原因。最终决定就是,这个磁体是没有上正式装置的,我们就把它作为后续的实验的测试件了。
分析下来的原因,到现在也不完全能够百分之百锁定,但我们怀疑可能是制造过程中的一些振动可能造成了机械损伤造成的危害。
当然,我们后面就有在全链路过程中防振动的工艺安排,从制造也好,运输也好,所有过程都做了这件事。
后续所有磁体都没有这个现象,我们大概觉得应该是这个方向。但是哪个环节我们也不知道——是加工环节、运输环节,甚至说我们这加工或是别人那加工,都不知道。你只能全链路把这个事弥补掉,而这件事毕竟它是到完整磁体交付的前一步出的问题,那你就相当于要重做一个。
当然这是工艺验证件了。做的好的话,full size全尺寸,我们可能就会用做正式件。最终没有用,就造成了整个项目要多造一个。
也没啥惊心动魄的,你看到性能下降,一分析原因,分析了半天也不完全确定,最终在整个生产制造所有的内外部供应商里面全部都按猜测的原因去调,期待第二个能够成。第二个成了,那你就放心了。
张小珺:你们一开始就做了一个“三步走”战略,能不能展开讲一讲?
杨钊:第一台是当时洪荒70那台装置,我们叫原理样机,验证用高温超导的新材料建一台完整的装置到底工程可不可行,工程可行性的一个验证。这台装置在去年我们交付了。
第二台装置是我们洪荒170这台装置,它是一台能够实现十倍能量增益,并且在全世界范围内成本最低地实现这个性能的装置。用这种技术去造,它能做出来一台跟火电成本差不多的聚变装置。在这种成本条件下,能不能去实现比如Q≥10这样聚变性能的参数。如果可以,用来建一台示范电站的核心技术以及我一直在强调的成本这件事情,都是一个可以商业化的技术了。
我们希望从现在开始三年时间,就是27年底之前,能将这台装置建成。这是我们的第二个里程碑。
一旦这个装置建成,并且去实验运行,拿到跟我们设计一样的Q≥10结果,我们认为这个技术是足以支持建一台聚变的示范电站,这是我们的第三台装置。希望在30到35年这个时间点建一个大概电输出功率在50万千瓦的中型火力发电站规模的聚变的示范电站。
当然第三台装置对我们就是一个商品、产品,我们将它卖给国内去建聚变电站的业主,有可能是这些核电业主,如果是氘氘去做的话,它因为不涉氚,可能是地方的能源的央企、国企,都有可能。对我们来说,我们作为最核心的设备供应商,我们把这个托卡马克卖给这些核电业主。
张小珺:这个周期好长,要从21年到35年。
杨钊:差不多10到15年的时间点。
张小珺:你们最近发了经天磁体,这也是你们一个标志的里程碑,它对洪荒170非常关键的部件?
杨钊:它是个非常重要的部件。
单说经天磁体本身,它应该是全世界磁场强度最高的一个大孔径的磁体。之前这个记录是美国最开始提出高温超导托卡马克技术路径的美国的CFS公司和MIT在2021年底做的一个叫TFMC的磁体,当时他们做到刚刚超过20特。
张小珺:你们是21.7。
杨钊:我们将这个参数又提高了接近不到10%的状态。
现在全世界有能力做出来这种大孔径的超过20特磁体的团队就是我们,还有美国的CFS两个团队。毕竟我们用这个材料就是为了高磁场,我们现在这个参数应该是全世界磁场强度最高的磁体了。
张小珺:你们怎么做到比较高特斯拉的磁场?现在是最高的了。
杨钊:从原理上来说,要实现一个很高的磁场,需要很大电流,通过大电流产生一个大的磁场。
一个最简单想法,比如我有一个内径要求,就是我那个大口径的要求,我在外面缠足够多超导的导线、导体,我再给它通足够大的电流,它就总是能够形成一个很高磁场。
但这个过程中,你会遇到新问题,比如当你磁场很大、电流也很大,物理上你的受力是很大的,因为你的安培力等于磁场×电流。也就意味着当你的电流又大、磁场又大,你导体自身就会在这个磁场下受巨大的力。当你这个力很大的时候,怎么办呢?
一般它就想我加很多结构材料,比如我用很多的钢把它这个力扛住,这个时候就会造成一个问题——如果你加了足够多的结构材料,你可以把力分摊掉,但你截面工程电流密度会掉下来,因为大部分截面的面积是没有办法通电的,它是结构材料。这就跟我们的设计是有矛盾的,我们不仅要高磁场,而且要很高的工程电流密度。
工程电流密度的好处在于,我们可以在达到相同磁场的情况下,一个更高的工程电流密度就意味着我这个截面的尺寸可以变得更小。工程电流密度就是单位面积上通过电流,当我电流总量定死,电流密度越大,我的截面的面积就越小,最终就会使得我的装置可以造得更小。因为我就不需要那么大的面积去支持这个电流,可以造一个很小的面积去支持这个电流。
经天磁体不仅是磁场最高的一个磁体,它还是工程电流密度最高的一个磁体。这两个参数同时达到,才能实现聚变这个装置的小型化的目的。
当电流大了,磁场大了之后,不仅受力是一个大挑战,还有一个是电流很大的时候,它会发热。大家都知道“欧姆热”,正比于电流的平方再乘以电阻。比如我们接近22特的时候,单股电流大概在20多千安。大概1纳欧的电阻就有接近1瓦的发热量。对于低温来说,瓦级别的发热量来说已经蛮大了。而它要求的是在这么大的电流下,你需要将整个磁体,因为你不可能所有的都是超导,还会有一些接头连接的部件在过程中也会发热,你要把总发热量控制在百瓦级别,你就需要将所有这些连接,甚至加工过程中引入的电阻,控制在100纳欧这个量级,就是100×10的负9次方欧姆。
也就是说你对于热学的控制需要做到非常小的一个电阻。而且在这个情况下,你为了把这几百瓦的热量散出去,你还要专门在这个磁体里面设计出来让它散热的流道,你要把制冷的氦都给它供给到你预测它可能会发热的地方,才能使这个磁体稳定在你的设计温度下去运行。
在这个过程中,刚刚已经说了我的磁体为了高工程电流密度已经寸土寸金了,不能放那么多结构材料,你还得挖出来一些洞,让你的流体,让你的制冷东西过去,所以在你真正平衡力、热、电的过程中,你就得去判断怎么样的设计把这三个东西的尺寸都压到极致,且能让它稳定,这样才能设计出来一个高磁场且高电流密度的磁体。这是在设计中它就将所有的参数都推到了一个非常边界、非常极限的状态,这才刚刚完成了设计。
设计完成了之后,到底这个东西能不能加工出来?我们刚才说的这个东西,你现在设计的都是完美的导体,没有什么工程缺陷,也不会在加工过程中性能还衰减,你要把这些超导带,把这些有各种非常复杂结构的骨架并到一起、组装到一起,中间有绕制、浸渍、接头的制作,一系列的工序,最终性能都不衰减,才能交付。
这个过程中所有工艺的开发也是非常困难的一件事,这个过程中有大量研究的过程。
张小珺:它相当于洪荒170的一个心脏还是什么?
杨钊:它其实是洪荒170的很关键的系统环向场磁体(TF)。
环向场磁体有18个。这18个磁体在170上拼起来之后,它的最高场大概是23特。
而我为了充分验证我在23特的条件下可以做出一个磁体,所以我的经天其实是用一个磁体就实现了接近23特的参数。
它是对于170的环向场磁体从设计到工艺的非常充分的验证。因为它不会直接上170,但是用制造经天磁体的设计方法和工艺加工方法,我们肯定是能做出来170的环向场磁体的。因为那个磁体的参数没有这个高。
张小珺:为什么不能直接造洪荒170?
杨钊:第一,洪荒170是一个成本很高,差不多30亿的设备,所以在几年前刚开始创业的时候,我也没有能直接拿到这样一个资金支持的能力,以及完全没干过托卡马克的四个人的团队拿到这样一个体量的资金几乎是不可能的事情。
另一方面,一个托卡马克没有干过的团队怎么能有信心把这样一台全世界最高参数的装置建起来?在这个过程中,我们就设定了,比如我们先造一台参数比较低的像洪荒70这样的装置造价可能1.5亿人民币,结果花了大概1.2亿人民币做出了这台装置,这样的话证明我们有系统工程能力,在很短的时间内把一台完全自己设计的这么复杂的装置交付,自己设计、建造、交付。
这台装置,低参数装置和高参数装置最大鸿沟在哪?就是每个子系统的参数都变得很高。比如70最高的磁场是3.1特,170最高磁场23特,这么高一个磁场,大概接近10倍的变化,我就做一个子系统,比如经天磁体这样一个系统,能做到22特左右,我就可以验证我有能力把170做出来。
通过这样一个完整装置验证,还有最核心、最困难的、也是成本最高的子系统的验证,当然我们同步还会做其他子系统的验证,最终证明我有能力把170做出来。
我再拿到170这样建造的资金,无论是从里子里,就是我的团队的能力能不能造出来,以及资金的支持上,因为你团队有这个能力,所以大家才会相信你,给你这个钱,让你把这个装置做出来。
张小珺:你们验证下来,做出高温超导相比低温超导最终的优势体现在哪些?
杨钊:优势就是磁场高导致的装置尺寸小,造成的成本低。
为什么是我们在推这件事,或者说国内唯一在推这个事的人?就是因为这个东西太新了。
张小珺:成本能下降百分之多少?装置能小多少?
杨钊:跟ITER同样性能,Q大于10,装置的体积大概是ITER的2%,小了50倍。
成本大概也是50倍左右,大概从250亿欧元,在我们看来4亿美金就能做出来。
张小珺:洪荒380是磁场更高吗?
杨钊:会高一些,大概从23特到29特左右。
装置的大小也会更大一些。380比170的尺寸又大接近一倍。整个装置,线性尺寸大了一倍,可能体积二的三次方,接近大了十倍。磁场更高了一些,从23特大概到了29特。
它作为一个示范电站,170还是个实验装置,我不会去造一些让它长时间运行的水冷系统,包括把它产生的能量导出来的这些水冷系统,都不会去做。这是最小化成本的一个方法。当然380,作为电站,你这些都要做的,所以它的尺寸都会往出挤。
所以380是一个完整的能够长时间运行的示范电站的要求做,而170只是个实验装置,短时间达到实验参数的目标的最小化成本的东西。
张小珺:380需要多少成本?
杨钊:我们的目标实际上是希望将380的售价做到1000瓦4万到5万人民币的水平。
对于一个500兆瓦的装置来说,大概是在200到250亿人民币量级。刚刚我们国内新建成的第四代裂变的第一台示范堆,高温气冷堆,大概是1000瓦在4万到5万人民币,而我们认为如果第一台聚变示范电站能做到这个成本,因为我的原料是没有放射性的,我的反应产物也是没有长时间反射性的,就是我比裂变电站,无论从原料的可得性,还有它的安全性,以及废料的处理上来说,都有非常大的天然的优势。
所以当我的造价跟它一样的时候,这台电站对于核电业主来说可能是有比较大的吸引力的。这就是我们的目标。
张小珺:总共大概是多少?
杨钊:200亿到250亿人民币。你说的造价,我说的是售价。
单纯的成本我们估计在100亿到200亿之间。
张小珺:100亿到200亿之间,再加上170需要30亿,所以总共相当于需要200亿左右?
杨钊:第三台装置,洪荒380实际上是我们的一个产品,是我们卖出去,我们作为这个产品设备的供应商把它卖出去的。
对我们来说,我们团队内部需要的钱主要是把170这台装置建起来,大概30亿人民币。
“我们感觉Helion是
科学风险很高的技术路线”
张小珺:你们和Sam Altman投的那家Helion Energy技术路线不同吗?
杨钊:不太一样。Helion也是磁约束,但它的磁场卫星是直线的,不像我们是甜甜圈。
他们叫做场返位形的,英文叫做FRC(Field-Reversed Configuration),场返位形的装置。
从已经公开的学术资料上说,现在最高参数的场返位形的装置大概“三乘积”做到,我没记错的话是17次方,可能还没到18次方,所以大概还差21次方,还差4个数量级。
所以,我们感觉这是一条科学风险很高的技术路线。
打个比方,比如我现在要造一架飞机,我现在有0到10米的飞行的实验数据,我用这个实验数据外推到万米高空,我去设计一架飞机,你很有可能在外推的过程中根本意识不到空气在变稀薄、气温在变低这些事情,所以你用0到10米的空气动力学的实验数据外推到万米高空,大概3个数量级,你可能设计出来的东西最终在那飞不起来。
这就是当你比如说到17次方的实验数据,你要外推到21次方,面临的是一样的问题。你不知道从17次方到21次方的过程中,会不会有一些新的或者是涌现的新的物理过程会引入,在你的方程里面可能原来都没有。如果有,可能现在这个外推的设计就失效了。
当然,如果运气非常好,什么新物理都没发现,甚至可能新物理是帮你,对你有增益的,那当然更好。
但是这些事情在我看来都是属于科学风险,甚至这个问题的答案是否存在都不确定。我们觉得这种事情其实更适合科研院所或者是大学去做。
张小珺:他们更激进一些?
杨钊:对,我们认为没有在科学可行性上已经完成了验证。
张小珺:他们为什么选这个方向?
杨钊:这个我就不知道了。能够看到的一个结果,包括美国有很多的聚变公司,几乎不存在有两家聚变公司的技术路线完全一致。
我刚才说的聚变这件事的先手优势太强了,领域里面也没多少人,每一件事都需要很多的资金——所以同一个技术路线上的第二名其实是比较难存在的。所以一条技术路线上,可能投的第一家,也就把所有的人才,包括自己培养的资金什么都拿到了。
张小珺:并不是因为竞争带来了垄断,而是因为人才垄断、资金垄断?
杨钊:对。导致第一名会比第二名的优势高很多,那么就没有理由再去支持第二名了。同一条技术路线上,除非你换一条技术路线。
张小珺:在技术路线上,CFS和你们更相似一些?
杨钊:对。
张小珺:核聚变和AI的关系是什么?
杨钊:基本的逻辑是这样的,首先现在AI肯定是在一个指数增长快速发展的过程中。一个基本的物理定律告诉你的事情是任何一个指数增长的东西它会持续增长下去,直到遇到一个瓶颈。
比如说短时间大家可能觉得AI的瓶颈,像算力的瓶颈、芯片大小的瓶颈、数据的瓶颈,如果产能能供起来,数据能生成,再往下一个真正的大的瓶颈是能源供给的瓶颈。因为它牵扯到的基础设施的要求是很高的,如果它成为主要的耗电,现在已经占到百分之几了,如果它变到百分之几十,就意味着需要有更大规模的能源供给。
其实能源这个事,它的需求永远是不缺的,只要是能够提供这个能源,一定会被使用完,关键就是能不能提供这么多能源。
但是所谓的能提供这个能源的核心逻辑就是你的能源成本能不能降下来?你同样的成本不变的情况下,你提供不了更多能源,因为它没有收益。只有当你的成本能显著下降之后,你才能数量级地增加能源的供给。而我们认为只要你能够增加能源的供给,它一定会被迅速地使用干净。
张小珺:PMF天然是存在的。
杨钊:对。就像电脑,你从来不说你计算的能力、供给的能力是远超的,但凡你的性能一旦上去,一定会有一个应用把你的新的电脑的性能全部用干净,所以能源也是一样的。
我们觉得AI肯定也会在不久的未来也会因为能源成为一个瓶颈。当然现在可以看到很多大型的计算中心它的耗电量非常大。像美国这边很多的聚变或者支持新能源、支持聚变的公司都是这些互联网或者AI公司,他们也在为下一步尤其是无限能源供给的这件事情在布局。
张小珺:反过来呢,AI对于核聚变?
杨钊:AI对于核聚变来说也是一个非常有效的降本增效的过程。
第一个是我在装置运行的过程中,可以很快且精准地提供实时的AI驱动的控制手段。因为你控制的实时性要求很高,传统模型计算的复杂度很大,非常复杂的模型是没有办法用来实时控制的。但现在随着AI加速,包括对于这些非常复杂的物理过程通过AI science等效的模拟,就可以提供精度又比较高、且运算时间很短的算法,这种算法对于我最终装置的实时控制实际上是有很大的帮助的。
包括一两年前DeepMind在欧洲的一台托卡马克上完全用AI做它的控制,在短的时间、很少的迭代周期内就能做到原来人们可能花了很多的时间通过实验积累才能做到的实验位形。所以AI的第一个事是对于装置的实时控制是有很大帮助的。
第二,它可以帮我们代替一些诊断的设备。很多高精尖的诊断其实它的成本很高,而且研发的难度也很大。这个逻辑就有点像把AI应用在一些图像或者是医疗领域,就是增强你诊断的能力。
你可能不用造一个成本很高的硬件设备,但是基于AI的算法,它可以给你一个精度更高或者分辨率更高的诊断的结果,所以AI在诊断系统上的使用也是现在大家在研究的一个大的方向,它带来的就是你降本增效的手段。
第三,在等离子体模拟上,如果我们的模拟足够的精确,原则上我们不需要做实验。当然你的现实和你的模拟就是有偏差的。比如你设想的是一个理想的装置,但你加工过程也会有零点几、一个毫米的偏差,你装配也会有偏差,你这儿有个洞,原来设计的理想模拟上是没有的,所以这些东西都可能造成你用第一性原理对于理想模型的仿真和真实的情况是有gap的。
如果我可以用一些AI的模型,我用一些真实的实验数据作为输入去训练这样一台已经建成的装置的仿真的软件,我都不需要拓展到其他的装置,就对于这台装置我的预测能力足够强,它就可以大大地减少我通过实验最终拿到我想要的参数的过程。因为原来你可能需要做一百次的实验,现在可能做了一两次的实验,在你的仿真环境里已经能够得到很好的预测了,那中间很多的实验就不用做了,你就可以往下一个阶段去做实验了。
所以,它基于一个更快速且更精准的等离子体的预测,使得你实验的周期会变得很短。
AI对于整个聚变来说它的整体的效果就是降本+增效,减少时间的成本,减少资金的成本,它的使用场景就是在控制、诊断,包括实验运行这些方向上都是能够提供很大的帮助的。
张小珺:Helion声称在28年建成世界首座核聚变发电站,你们是在35年,你们要晚7年?
杨钊:对,28年建成一台聚变电站确实非常激进,而且就我们团队内部来说,我们不完全理解从原理上来说它的那套东西为什么会work。
当然,这家公司它公布的资料很少,我们很难判断,比如确实有些物理是我们没有考虑到的,他们有非常独到的一些物理的理解。
但基于大家现在都公开的资料,以及物理学大家知道的这些知识来说,我们不完全理解这条技术路线他们最终怎么去实现能量盈亏平衡的问题。
张小珺:国外有CFS、Helion,国内也有一些公司,包括你们、循环智能等,中美核聚变的格局以及进展有什么差异?
杨钊:一个基本态势是中国和美国都是发展非常快的,而且主要是这两个地方对于聚变这个事的投入也好、进展也好都非常快的。
这两个市场也是天然分割的一个市场。什么意思?大概率中国的聚变技术不会靠美国去帮我们实现,所以这件事中国肯定需要自己的团队把这个事做成,而美国也不可能大概率不会是从中国进口这样的技术去帮它建聚变电站,所以它也有它本土的团队去做这件事情。
无论是从需求上,从资金能够提供的体量上,从人才的储备上,从供应链和技术的储备上,这两个地方都是大概率最早恢复实现聚变的两个地方,且他们之间应该都会有自己的团队在做,这是一个基本判断。
当然现在来说,大部分商业化的投资还是发生在美国或者西方国家,总共融资额,聚变领域有大接近60亿美金了,美国这边,西方这边有40家创业公司了。
国内的创业公司不到10家,应该是几家的样子,比较少。现在应该是到百亿人民币这个量级,总共加起来。
我们的判断是中国和美国大概率是最早实现聚变商业化的地方,且大家都是一个相对来说技术比较独立——你也不知道别人是怎么干的,大家也大概不知道你是怎么干的,大家都自己去干。
张小珺:核聚变发出第一度电到底有多难?
杨钊:还是以跟火电成本差不多的条件去发出第一度电,确实比较难。
我们认为,2030-2035年的这台装置洪荒380的这个目标,不计成本的话,其实像ITER也能做到。
张小珺:其中最难的几个问题是什么?
杨钊:有几个GAP:
第一个是你先得是一台发电装置,当然Q要足够大,比如Q大于等于10,你要证明你的输出能量远大于输入能量,而且这个等离子体你是能够实现且能够稳住的。这就是170的目标。
第二个就是我们在380需要解决的问题,你不只是一个短时间能够让它去稳定住,你需要很长时间,长脉冲去实现一个高参数。这件事对于你的每一个子系统的工程稳定性,对于整个装置的热稳定性,长时间运行过程中控制的稳定性都是提出了非常高的要求。你不能任何一个系统,比如说这个系统自己就运行不了5个小时,那你肯定整个装置就不能运行5个小时,每个子系统可能就熄火了。
在长时间稳定运行这件事情上的话,它对于最终实现聚变,聚变电站未来甚至周级别、月级别运行的一台设备来说,这是一个需要去跨过的坎儿,现在state of the art大概是做到EAST 1000秒,这本来到1万秒,甚至10万秒来说都是坎儿。这是第二件事,长时间稳态运行。
第三件事就是在我们看来,真正的聚变商业化它的原料其实是需要用氘氘去发电的,而不是氘氚。因为氚,第一它是一个管制很强的东西,你用氚是能造氢弹的,所以监管也好,成本也好,都是非常高。导致的结果就是,直接结果就是你的度电成本肯定高,而且你的监管要求非常高,所以你无论是设计上也好,安全的保护上也好,都是有非常高的额外的成本,并且监管的要求一放在这,你的建造周期一长的话,那你最终都会折算成度电成本。
而氚在自然界上也是不能稳定存在的,所以你需要一边发电,一边产氚,这件事对于很多工程上的难度也增加了。
张小珺:怎么产氚?
杨钊:产氚就是在你聚变过程中产生的中子去打锂6,就会产生氚,产生的中子之后,消耗了一个氚,但是你在过程中需要产生大于一个中子,用这些中子去跟锂6反应,产生大于一个氚,这样的话氚增值率要大于1,消耗了一个,产生了大于一个,最终把产生的氚收集起来再当原料送进去,这就是氚工厂所做的事情。
如果要用到氘氚,你势必要去做一个氚工厂,在装置运行的过程中还要生产氚,且把氚再送回装置里面去。
我们希望做的是氘氘的电站,我根本不需要氚,氘在海水里面多的是,够人类使用百亿年。我就只需要将氘作为原料,去进行聚变反应,我就不涉及氚了,整个装置包括监管,包括成本,甚至都不需要考虑氚工厂的事情。
我们觉得真正规模化商业化的电站需要解决这个氘氘的问题,氘氘反应要比氘氚还是要再难一个数量级。
张小珺:从发出第一度电到成为一个全球的主流能源,中间要跨越多少年?
杨钊:我们可以做类比,当年第一台裂变示范电站到真正产生商业的裂变堆,大概经过了十年。
时间尺度上差不多。第一台聚变的示范电站到它成为一个商业化的电站,可能也是这样的一个过程。
张小珺:如果氘氘聚变能够实现且能源成为无限的,世界会变得怎么样?
杨钊:当能源可以极其廉价地使用,文明会变得很不一样。
比如说很多的问题,粮食还是不是需要种植出来,还是我可以工业合成,主要成本其实就是能源的成本。如果你的整个能源供给都非常便宜,大量的现在可能是靠一些自然过程产生的产品,都可以通过人工合成的方式去实现了。
我们现在还在考虑飞出地球,有大量的能源损耗。可能能源很廉价的时候,你也不在乎这个事,你可以去提供足够多的能源去产生,去做星际殖民。
只要是能源的结构产生了变化,人的文明都会跨一个数量级的。
这个事大概率是一个文明跃迁的变化。
“这场创业像一场持续地爬山,
山的高度是指数增长的高度”
张小珺:你会觉得每天很boring吗?在临港。
杨钊:每天很充实,每天都有大量的问题,大量的工作要去做。
这个感觉,生活上来说相对比较简单一些,就是工作、休息,大概就是这样——跟当年读博士也差不多,还好吧。
张小珺:生活就是两点一线?
杨钊:差不多。
早晨大概9点钟上班,晚上不一定,大部分(时间)可能8点左右。实验的时候可能就辛苦一点,就不一定了,通宵也正常。
张小珺:作为一个商业公司,你的目标是什么?
杨钊:怎么说?最短期的第一个商业目标就是把380这台装置卖出去,真的建一台示范电站,而不只是说像70或者像170这样的实验装置,这些都是为了把380卖出去做的准备。
商业公司嘛,你的核心还是要去把它商业化,把它做成产品。
张小珺:第二步呢?
杨钊:我刚才说的像380这台装置,它的成本还是比火电要高一些的,这台装置建成运行了,就要考虑怎么去把这个成本降到,我们的目标就是比火电低一个数量级。
通过在哪些设计上的优化,哪些原料上的成本降低,哪些工具工装上的降低,使得批量化之后你的成本可以再降一个数量级。
张小珺:你有遇到一个坎,觉得过不去了那种吗?
杨钊:至今没有。你回看,其实大家还是胆子挺大的,最开始4个人啥都不会,说实话,因为没干过,完全没建过。
但那个时候就觉得应该像70这台装置两年努努力能建起来。
当然前期确实有很多都不懂,边学边干。
现在再回看感觉竟然把它干出来了,但你在最开始,你有没有觉得它是什么不能干出来,只会觉得我有这么多的问题需要去解决,可能跟我们现在去看170甚至380的感觉是一样的,有这么多的问题需要去解决,你只有把它干完之后,你才意识到有这么多的难题,回看的时候感觉当时很勇敢,但其实你在经历的过程中,只是看到的是有一堆问题,且这些问题我们的判断都是有解的,我们需要把这些解找到,就这么一个过程。
至少到现在为止的话,没有感觉到有什么不能做的,或者no go的东西。
张小珺:有压力很大的时候吗?这个压力好像是分散的,它不是一个集中的。
杨钊:对的。
短时间的,从波动上来说最高的肯定是每次做实验是压力最大的,因为那就是你干了这么多年的项目,两年的项目,最终能不能实现。点亮那一刻前面的调试。
张小珺:点亮那一刻之前是什么心情?
杨钊:调了蛮久的,并不是那一刻产生的事,你可能调了一两个月才调出来。
所以调不出来就想怎么还调不出来,哪一步不对,哪个设备没有达到它的运行的条件,不断地找问题,不断地计算,直到亮了。
亮了那一刻?亮了就亮了——这事亮了——好的。
张小珺:就下班回家了是吗?
杨钊:那天就不用熬夜熬特别晚了。
张小珺:平时给团队打气吗?
杨钊:可能这方面做得少一些,基本上没有过团建,做完这个项目就马上赶去下一个项目了。
张小珺:你觉得你作为一个CEO的长板和弱项是什么?
杨钊:长板可能是相对来说比较理性,情绪非常稳定的一个人。
劣势,跟情绪相关的一些事情,我做得确实比较少。
张小珺:对于快速变化的世界,你觉得你最远能看多远,特别是在能源变革上?
杨钊:(此处停顿4秒……)只能看到趋势,你说十年之后具体这个东西会长成什么一个具象的样子,很难。
十年之后,聚变,至少第一个示范电站能全世界建成,这件事可以看到。
再过十年,商业化能不能做成,我觉得大概率能做成,但是具体长成什么样子,是哪一个事情的优化相比于示范电站能够实现这个事,不是很清楚。
只能里程碑式的总结性的节点,你可能能看到十年、二十年这个样子,但是如果你要看一条路过去的话,大概可能看到五到十年这个阶段,你能看到一条路怎么过去,再往后的这条路可能都是分岔得很厉害,猜不到是什么变革,那个时候需要你更多的信息才能够做一个路径上的判断。
张小珺:你觉得有什么原因能让奇点会失败了?
杨钊:想想。(此处停顿6秒……)人不够,钱不够,事没做成,三个事吧。
钱不够,你可能下一个想做的事都没法启动,那就只能一直等机会。
如果钱够了,人不够也好,事没做成也好,最终交付的时候没达到你的设计目标,还有没有一个second round机会,不一定。因为每个东西的成本都很高。人不行可能是一个过程,它的反映还是事没做成。
我觉得这两个,钱不够和事没做成,一个没法启动,一个没法交付,这两个东西没做成,比如170,380你肯定卖不出去。380你要是能卖出去了,没做成,一样的。
我们商业逻辑的核心点,你刚才说了它的PMF是简单的,需求是个真需求,它的产品是一个明确的产品,只要你能做出这个产品,需求一定能满足,就是能不能把这个产品做出来的问题。
能不能把产品做出来的问题就是,你有没有资源让你做这个事,以及有了这个资源,你能不能真的把它交付到跟你设计一样成本足够低的东西。只要你能做出来度电成本比火电低,就是能成,它的问题就转化到一个非常明确的问题上。
张小珺:你们怎么形象化来描述这个创业?像走钢丝吗?——好像也不像。因为你每天生活很平和,而且偏安一隅。
杨钊:它是一个持续地爬山。这个山的高度是一个指数增长的高度,只不过你可能每一步,从最开始可能一次只能迈一小步到最后一步能迈一米,你可能有更先进的装备,后面一步能迈十米。
张小珺:没做成就摔下去了?
杨钊:滚下去了,就是这样一个过程。
而且这个山什么时候有没有一个封顶的高度,我至少现在还没看到。
你已经爬到的地方都是你的积累,但你可能未来要做的事是越来越高的东西,而且增长速度是越来越快的。
张小珺:如果这个山没有登上去,摔下来了,你会怎么想?
杨钊:很可惜,会非常可惜。
但是看看有没有机会接着往上。看你摔到哪,接着再往上去爬,菜就多练嘛。
我觉得主要就是看不到一个爬不上去的理由——如果爬不上去就说明菜,那就能不能别那么菜;或者能不能菜就多练,再接着往上爬。
2025-04-16 19:15:18
腾讯新闻《潜望》 作者 晓尧
编辑 刘鹏
被“留置”近三个月的张剑,回到公司后却发现国内两轮电动车市场已经“变天”。
4月15日晚间,有“电驴之王”之称的爱玛科技(603529.SH)发布了2024年度业绩报告,从财报数据看,爱玛科技2024年实现营业收入216.06亿元,同比增长2.71%,净利润19.88亿元,同比增长5.68%,吊打了营收、净利润双双出现负增长的“一哥”雅迪控股(01585.HK),但却在“新势力”九号公司(689009.SH)的双位数增长面前,尽显疲态。
而陷入“留置”风波的张剑,正是电动车头部企业、上市公司爱玛科技的实际控制人、董事长兼总经理。在2024年胡润研究院发布的《2024 胡润全球富豪榜》上,张剑家族以165亿财富位列榜单1577位。
增长慢了
在中国的两轮电动车行业,张剑和他一手创办的“爱玛”是绕不开的印记。
据公开消息,出生于河南商丘的张剑,1999年北上天津创办了泰美车业有限公司,并于2004年进入两轮电动车制造领域。后公司经过多轮股权转让、增资,泰美车业在2009年变更为天津爱玛科技股份有限公司。
也正是在2009年,爱玛科技进入了一个快速增长的时代。
这一年,为了把爱玛品牌做大做强,在野蛮生长、竞争激烈的市场站稳脚跟,张剑拍板斥巨资签下了当时如日中天的流行乐坛巨星周杰伦担任代言人,而周杰伦的“爱,就马上行动”的广告语也让爱玛电动车火遍全国。
在张剑的带领下,爱玛的销售表现、市场份额每一年都会出现飞跃式的增长,将当时的行业知名品牌比德文、绿源、洪都、速派奇、小羚羊等远远甩在身后,并在2013年超越了当时的行业第一名新日,真正成为电动车头部企业。
而为了解决公司进入高速发展、快速扩张后的资金问题,谋求IPO、登陆资本市场融资成为张剑的一个必选项。
从2012年开始,爱玛科技先后三次启动IPO计划,除了2012年因内部高管问题终止外,2018年、2019年两次冲刺IPO遭遇证监会“灵魂拷问”、因“专利诉讼”被取消审核受挫。
张剑和他的爱玛科技的IPO之路,终于在2021年迎来收获。当年6月,爱玛科技登陆上海证券交易所主板市场。而在此前,爱玛在行业内的对手新日股份、雅迪控股、小牛电动都已经在A股、港股、美股上市多年。
上市后的爱玛,连续两年交出了亮眼的业绩,2021年、2022年营收分别为153.99亿元、208.02亿元,同比增长19.33%、35.09%;净利润分别为6.64亿元、18.73亿元,同比增长10.94%、182.14%。
但进入2023年以后,爱玛明显进入了瓶颈期, 财报数据显示,其2023年营收为210.36亿元,同比仅增长1.12%,增速显著放缓;归母净利润18.81亿元,同比微增0.41%,扣非净利润17.64亿元,同比下滑1.83%。
2024年爱玛虽然在营收上达到216.06亿元,同比增长2.71%,增速较2023年略有回升,但仍远远低于2022年交出的35%的增长;净利润方面,2024年爱玛全年归母净利润19.88亿元,同比增长5.68%,扣非净利润17.92亿元,同比微增1.54%,相对于刚上市的2021、2022年,增速也明显放缓。
市场变了
虽然在营收、净利润增速上承受着放缓的压力,但爱玛科技仍然在2024年全面碾压两轮电动车“一哥”雅迪控股。
雅迪控股近期发布的2024年业绩报告显示,2024年度雅迪控股全年营收282.36亿元,同比下滑18.8%;归母净利润12.72亿元,同比呈现51.8%的断崖式下跌,创出近五年来的新低。
从销量数据上看,2024年雅迪电动两轮车总销量1302万辆,相较2023年卖出的1650万辆,下降了21.18%。虽然2024年电动两轮车企业普遍承受着销售下降压力,但雅迪的销量下降幅度远远超出了全行业11.6%的降幅。
面对最大的竞争对手雅迪陷入增长困境,在净利润收入上成为“一哥”的爱玛科技,却面临同样的问题。因为对于传统的电动两轮车巨头们来说,市场已经变了。两轮电动车卖不动的现实压力,不仅仅考验着雅迪控股,也冲击着爱玛科技。
作为两轮电动车龙头企业,爱玛科技在主力产品的销售上,已经出现了两连降。
公开资料显示,2023年爱玛电动两轮车卖出1028.96万辆,比2022年的1050.65万辆销量,少卖了21万辆。
2024年,在产品销量上,爱玛继续下滑,主力产品电动两轮车(电动自行车+电动两轮摩托车)总销量989万辆,已经跌出了千万辆规模。
尽管主力产品的销量在持续走低,但爱玛科技的运营费用却保持着高增长态势,财报数据显示,2024年公司销售费用为7.78亿元,同比增长21.33%;管理费用为5.54亿元,同比增长16.84%;财务费用同比增长33.07%。
传统头部电动车企业销量见顶的背后,是中国两轮电动车产量已经触及到了市场“天花板”,产能显现出过剩迹象的严峻现实。根据中商产业研究院给出的数据,在2023年末,我国两轮电动车市场保有量就已达4亿辆。若以全国家庭户数计算,每5户家庭就拥有4辆左右电动车。
行业报告数据显示,2024年中国电动两轮车年销量为4950万辆,同比下降了11.6%。而2024年中国两轮电动车总产量预计在6800万辆左右。
销量下滑、产能过剩,给行业龙头企业们带来库存压力,也体现在了财报数据上。
2024年,雅迪的存货由2023年的9.55亿元增加至2024年底的12.79亿元,增幅33.9%;爱玛科技的库存量也在大幅攀升,其电动自行车库存量大增27.26%,电动两轮摩托车库存量大增60%。
但值得注意的是,传统巨头们遭遇到增长压力,并没有在新势力企业身上表现出来。曾经是爱玛、雅迪主要消费者的年轻人,正在集体抛弃传统品牌。主打高端、智能化的新势力们,正在攻占年轻人市场。
比雅迪、爱玛成立晚了十几年的“新势力”九号公司(689009.SH),4月11日公布了2024年年报,2024年公司营业收入为142亿元,同比上升38.9%;归母净利润为10.8亿元,同比大幅增长81.3%;两轮车销量实现259.9万辆,同比大幅增长76.6%。而主业是电动平衡车的九号公司在2019年才进入两轮电动车市场,短短几年就成为公司第一大收入来源。
专注于高端智能电动车业务的小牛电动(NASDAQ: NIU)在2024年的营收、毛利率均保持了24%、15.2%的双位数增长。
另外一个将会改变全行业发展趋势的节点是,《电动自行车安全技术规范》(GB 17761—2024)将于今年9月1日正式实施,两轮电动车行业也正式进入新国标的下半场。而新国标将通过提高准入门槛,加速行业洗牌。
中信证券认为,“当前行业政策导向已十分清晰,伴随新国标的具体细则出台,顶层设计也已完成,龙头企业将会凭借其在合规和产品迭代能力的优势,加速推进拓展市场份额”。
高管套现
除了营收、净利润遇到增长瓶颈,爱玛科技在2024年遭遇到的最大风波,就是实际控制人、董事长兼总经理张剑被“留置”事件。
2024年10月11日,爱玛科技公告称,收到公司实际控制人、董事长兼总经理张剑家属的通知,其于2024年10月9日收到由承德市监察委员会签发的张剑被留置、立案调查的通知书。对于张剑被留置的原因,爱玛科技表示“公司尚未知悉上述事项的进展及结论,也未被要求协助调查。”。
直到2025年1月8日,爱玛科技收到由承德市监察委员会签发的《解除留置通知书》,决定对公司实际控制人、董事长兼总经理张剑解除留置措施,张剑正式回归到公司运营中,市场和投资者也没有了解到张剑被留置调查的具体原因。
对此有律师界人士表示,留置主要用于监察机关的调查程序,适用于涉嫌职务违法或犯罪的人员,留置时间不得超过三个月。在特殊情况下,可以延长一次,延长时间不得超过三个月。而张剑被解除留置,则正好达到了三个月的时间上限。
在4月15日发布的2024年报中,爱玛科技董事长张剑按照惯例发布了致股东信,表示“在过去的一年里,行业、公司和我个人都经历了巨大的考验与严峻的挑战,考验是最为客观的度量衡、挑战是最高级别的成长礼,企业和我个人都在挑战和考验中实现了成长与跨越。”
在公开信中,张剑称,感谢各位股东、客户、供应商的信任和陪伴,期待与各位股东携手同行。
不过,身为股东的爱玛科技的高管们,在公司灵魂人物张剑被留置期间,已经趁着股价连续上涨的时机,纷纷套现“跑”了。
2024年12月23日,爱玛科技公告称,近日公司收到股东盐城鼎爱发来的《关于股份减持计划结果的告知函》。截至2024年12月23日,盐城鼎爱通过集中竞价方式减持公司股份860.93万股,占公司总股本的0.9991%,持股比例由4.1266%变更为3.1275%。盐城鼎爱本次减持价格区间为35.00-41.36元/股,减持总金额达3.21亿元。
公开信息显示,盐城鼎爱为员工持股平台,爱玛科技实控人之一、张剑女儿张格格持股27%,比例最高。除张格格外,爱玛科技董事、副总经理、董事会秘书王春彦持有盐城鼎爱10%的股份,爱玛科技副总经理李玉宝持有盐城鼎爱10%的股份。通过上述减持行动,张格格间接减持2324511股,套现8664.73万元;王春彦间接减持860930股,套现3209.16万元;李玉宝间接减持860930股,套现3209.16万元。
上交所公开信息显示,2025年1月2日,爱玛科技高级管理人员罗庆一减持9.68万股,变动后持股数为154.82万股;1月22日,爱玛科技公告称,公司副总经理罗庆一通过集中竞价方式减持公司股份67.37万股,占公司总股本的0.0782%;副总经理及财务总监郑慧通过集中竞价方式减持公司股份45.5万股,占公司总股本的0.0528%。
企业增长疲软、实控人被留置,爱玛科技高管却出现集体高位套现的行为,机构投资者也在逐步离开,截至目前,爱玛科技的持股减少机构超过30家。
爱玛科技2024年年度报告显示,截至2025年4月15日,共有447个机构投资者披露持有爱玛科技A股股份,合计持股量达1.35亿股,占爱玛科技总股本的15.69%。其中,前十大机构投资者包括陵水鼎爱创业投资合伙企业(有限合伙)、香港中央结算有限公司等合计持股比例达7.88%。相较于上一季度,前十大机构持股比例合计下跌了2.20个百分点。
公募基金方面,本期较上一季度持股减少的公募基金共计29个,主要包括南方中证500ETF、富国可转换债券A/B等,持股减少占比达0.63%。
2025-03-19 08:19:10
腾讯新闻《潜望》作者 晓尧
编辑 刘鹏
高端燕窝不好卖了。曾经风光无限的“燕窝第一股”的燕之屋(01497.HK)业绩暴雷:其公开披露的年报数据显示,2024年全年净利润为1.6亿元,同比下滑24.18%,这也是燕之屋净利润近5年来首次出现负增长。
在交出尴尬业绩几天后,3月18日,正在大力推行“年轻化”战略的燕之屋高调官宣万科集团创始人王石,成为其最新产品--“全球首款男人燕窝”总裁碗燕的品牌代言人。
有分析认为,深耕女性市场多年的燕之屋,在业绩增长失速后急切牵手王石,显然是希望在这位有一定影响力的“霸总”加持下,从中国的“高净值男总裁”群体中获得一些市场份额。
燕之屋业绩变脸
燕之屋近日公布的2024年业绩显示,公司全年实现营收20.5亿元,同比增长首次降至个位数的4.37%,年内利润为1.6亿元,同比下滑24.18%,为5年来首次负增长,净利润率更是跌破了10%,为7.8%。这也是燕之屋自2020年以来交出来的最差的成绩单。
2024年的业绩变脸,也在燕之屋的意料之中。在此前披露的盈利预警中,燕之屋就已经对利润大幅减少给出了三个方面的原因:
一是为深化品牌高端化战略布局,邀请了王一博及巩俐为品牌代言人;
二是公司在2024年5月完成新的绿色智能工厂搬迁投产,新工厂筹建过程导致生产略有上升;
三是受宏观消费环境结构性调整影响,线下客户的消费趋于保守导致线下渠道收入略有下滑。
对比财报数据可以看出,2024年之前,燕之屋的营收和净利润均呈现出正增长趋势:2020年至2023年的营业收入分别为13.01亿元、15.07亿元、17.30亿元、19.64亿元;归母净利润分别为1.23亿元、1.72亿元、2.06亿元和2.12亿元。
当2023年12月12日,经历了多次谋求上市遇挫,终于在第五次冲刺成功登陆港交所、成为“燕窝第一股”的燕之屋,显然没有想到,在港股上市仅仅一年多以后,自己就迎来了成长的烦恼。
盈利能力遭质疑、业绩增长放缓也打击了投资者的信心,燕之屋股价已经从2024年7月最高点的15.34港元,一路走低到3月18日收盘价的6.41港元,市值已不足30亿港元。
女性市场增长放缓
在高端化战略下,燕之屋投入大量的营销费用,尤其喜欢“砸钱”请明星作为代言人。
公开信息显示,从十几年前开始,燕之屋就尝试以重金投入,邀请明星代言作为主要营销手段,希望打开有“贵妇”标签的高端女性消费市场。
其首次启动的明星营销事件,是在2008年邀请知名女星刘嘉玲作为代言人,并迅速在内地市场和女性消费群体中打开了知名度。这也坚定了燕之屋在此后多年一直坚持着“明星代言”的营销战略,并先后签约了林志玲、赵丽颖、金晨等明星作为品牌代言人。
财报数据显示,2021年-2023年,燕之屋销售及经销开支逐年增长,分别为3.99亿元、5.04亿元、5.63亿元。
2024年燕之屋销售及经销开支继续大幅上升,高达6.71亿元,占总营收的32.7%,同比增长19%。一个重要的因素,是当年燕之屋重金签约了国际影星巩俐以及顶流偶像王一博作为双代言人,这一“高端化+年轻化”双策略营销支出,也是导致净利润出现负增长的主要原因。
与动辄数亿元营销费用相比,燕之屋的研发费用多年来不足营销开支的零头。2022年,燕之屋的研发费用为2432万元,2023年为2638万,2024年为2854万元。
重营销轻研发给燕之屋带来直接的影响就是产品的迭代和创新严重不足,也在一定程度上削弱了燕之屋产品在市场上的竞争力,尤其是其纯燕窝产品收入增长乏力,年内收入17.95亿元,仅与上年同期持平。
在市场竞争加剧、营销费用高企、业绩暴雷变脸的压力下,深耕市场二十多年的燕之屋遭遇到了增长难题。
此前公布的数据显示,燕之屋认为其毛利率由2023上半年的51.24%下滑至48.5%,主要是由于线下客户的消费趋于保守导致线下渠道收入增速不及预期,线下占比降低导致毛利率下降。
另外,燕之屋的线下门店也停止了扩张步伐,开始收缩线下布局,目前其全国市场门店数量为740家,而2023年其门店数量为743家,同期公司线下渠道收入为4.19亿元,营收占比为39.51%,较2023年同期下降1.64%。
“智商税”质疑与IPO往事
公开资料显示,作为国内燕窝食品头部企业的燕之屋,由自1997年从新加坡回国创业的黄健在福建厦门创办。2003年,燕之屋走出厦门,开启了全国性的连锁布局与扩张。
伴随着燕之屋的发展壮大,有关“燕窝”是不是智商税的争议如影随形。
燕窝产品是由氨基酸、胶原蛋白、唾液酸等成分组成,被民间视为滋补佳品。但科普资料显示,人体肝脏内就可以合成唾液酸成分,并不需要通过饮食摄入。即使需要补充,奶酪等食物也能达到同等效果。
有专家认为,燕窝蛋白含量虽然较高,但并不算是优质蛋白,且不易被人体吸收,进食一个燕窝的蛋白,实际摄取量还不如一个鸡蛋多。而从燕之屋京东旗舰店的价格看,由巩俐代言的规格为158gx30碗的碗燕售价高达14940元,3月18日新晋燕之屋代言人王石代言的产品——总裁碗燕,售价也要3168元,每碗单价为528元。
除了“智商税”的争议和质疑,燕之屋甚至还曾因为“毒血燕”事件,一度导致上市失败。
2011年,燕之屋在经历十多年的发展后,已经在全国布局400多家门店,销售额突破10亿元,踌躇满志的燕之屋创始人黄健第一次向资本市场发出冲击,但此时“毒血燕事件”爆发,燕之屋遭遇到创业以来最重大的打击。
公开报道显示,2011年北京的一位女性消费者在销售人员的推荐下,在北京富泽百川燕窝商行青年路店购买了“燕之屋”特级血燕。但在食用后,出现了呕吐等不适症状,后经检测发现,血燕内含有大量亚硝酸盐,超出国家最高强制性标准33倍之多。
2011年8月,浙江省工商部门对血燕经销商进行抽检,结果显示,包括丝燕之屋在内的11批次的血燕产品检出的亚硝酸盐含量最高均超过10000毫克/千克。
虽然调查结果显示,毒血燕责任在国外原料供应商,但“毒血燕”事件已经打击了消费者对燕窝食品的信心,燕窝进口随后也被监管部门叫停两年,燕窝行业至此遭受严重打击。
由于原材料无法进口,燕之屋首次港股上市按下暂停键,200多家加盟商门店受影响被关停。
2021年底,燕之屋在第二次冲刺港股IPO失败后转向寻求在A股上市,却遭到了监管部门的质疑。
当时的证监会反馈意见显示,在一些宣传燕之屋燕窝的软文广告中曾写到,清朝的皇帝因食用燕窝而长寿,慈禧太后也靠燕窝进行滋补,使得太后年过六旬容颜依旧……暗示燕之屋燕窝延年益寿功效。请具体列表说明公司广告等相关宣传材料的具体宣传口径,相关宣传是否存在虚假宣传等合规风险,公司是否因此受到行政处罚。
2022年9月,燕之屋主动撤回了IPO申报申请。
2022年11月,燕之屋向中国证监会厦门监管局提交了辅导备案材料,欲再次冲击“A股燕窝第一股”。不过,燕之屋随后又在招股书中透露,由于整体A股审批程序持续存在不确定性,考虑到公司未来的业务发展计划及在港上市可为公司提供获取境外资本的国际平台,公司决定寻求港股IPO。
2023年6月,燕之屋再度递表港交所,并成功闯关,成为“燕窝第一股”。
2025-03-17 07:47:30
腾讯新闻《潜望》 特约作者 王立广
编辑 刘鹏
公募基金粗放的“明星驱动”模式正在迎来终结。2025年以来,多家公募基金基金经理变更频繁,截至3月14日,已有超百只权益基金基金经理变更,其中更有多位曾经的百亿基金经理“清仓式”卸任。
3月6日,广发基金老将张东一正式卸任其管理的全部基金产品。这位曾掌舵超140亿元资产的明星基金经理,在2021年后所有在管产品均亏损,规模缩水超80%,黯然退出广发基金的基金管理。值得注意的是,公告显示,张东一已按规定在中国基金业协会办理变更手续,寥寥数语仅交代了手续合规性,却未提及她的去向——是转身幕后,还是彻底离场?市场猜测纷纭。
来源:广发基金公告
张东一的离任轨迹,是行业剧变的注脚。张东一从巅峰时期的百亿光环到黯然退场,她的经历折射出基金行业“造星神话”的脆弱性。而这样的故事并非孤例:华夏基金的周克平、嘉实基金的洪流等曾叱咤风云的百亿级基金经理,也在今年以“清仓式卸任”淡出舞台,留下业绩滑坡的争议与投资者的质问。
“投资者不再为明星光环买单。”一位资深基金研究人士如此总结。过去五年,公募基金规模从25万亿飙升至40万亿,广发等机构凭借刘格菘、蔡嵩松等“顶流”迅速扩张。然而,当张东一、邱璟旻、郑澄然等广发系明星基金经理接连折戟,规模与业绩的背离将行业推向拷问:投研体系是否失衡?风控机制是否失效?“基金公司赚钱,基民不赚钱”的困局何时能解?
以广发基金为例,其2024年三季报显示,张东一管理的某消费主题基金前十大重仓股中,五只个股年内跌幅超30%,但持仓结构却未见显著调整。类似的策略僵化现象,在多家“造星”机构的绩差产品中屡见不鲜。
广发基金张东一“清仓式”卸任 已无在管基金
3月6日,广发基金发布多条公告称,因工作安排,张东一自3月6日起卸任广发估值优势混合基金、广发睿智两年持有期混合发起式基金、广发聚优灵活配置混合基金、广发沪港深精选混合基金、广发品质回报混合基金5只产品的基金经理,卸任后,张东一已无在管基金。
更早的信号发生在去年的12月底,张东一卸任了广发消费升级股票基金,随后张东一在今年2月12日卸任了广发沪港深新机遇股票基金、广发沪港深价值精选混合基金2只产品,这两只基金后续均由李耀柱接任管理。
张东一早在2008年加入广发基金,曾任广发基金研究发展部研究员、投资经理,在2016年7月26日开始担任广发聚优灵活配置混合基金,这也是其管理时间最长的基金,截至今年3月6日卸任,张东一陪伴这只基金走过了8年225天。
虽然广发聚优灵活配置混合基金在张东一任职期间取得了82%的回报,但从2021年起,这只基金的业绩难言乐观。在最近的2024年,该基金年度涨幅1.41%,虽然勉强收涨,但严重落后同类的基金及沪深300指数涨幅,基金规模也从2019年的40亿元沦落到现在不足3亿元。
广发聚优灵活配置混合基金年度涨跌幅 来源:天天基金网
从张东一管理过的全部基金来看,凭借消费与医药板块的重仓策略,在2020年二季度首次跻身百亿基金经理行列,而到了2021年,张东一又接手了广发价值核心混合等多个基金,导致其管理规模在2021年二季度末达到峰值140亿元,但此后管理规模持续缩水,更加引发投资者不满的是,从2021年起,张东一新管理的基金在任期内全部出现负收益。
张东一过往管理基金业绩表现,腾讯财经制图
从上图可以看出,张东一所管理基金任职期间业绩最差的是广发价值核心混合基金,其管理业绩接近腰斩,该基金成立于2021年1月,是一只偏股混合型基金产品,在成立之初规模高达76亿元,由张东一担任基金经理,而到了2022年三季度末,受业绩净值大幅下降影响,该基金规模骤降至不到30亿元,或许受业绩压力影响,2022年11月1日,广发价值核心混合基金发布公告,增聘吴远怡为基金经理,与张东一共同管理该基金,到了2023年8月30日,张东一卸任该基金基金经理,任职期间净值下跌48%。
来源:广发基金公告
购买了张东一管理基金的基民也颇为不满,天天基金网讨论区显示,有基民喊话张东一调换重仓股转变投资风格,希望能少亏点钱。而在去年有基民更是在广发沪港深新机遇股票吧表示,拿了四年还亏39%,对张东一管理的该基金表现怨声载道。
来源:天天基金网
能够穿越周期的基金经理极少,从张东一管理基金的整体业绩来看,虽然也通过重仓消费、港股龙头股取得一定的业绩,但随着市场风格的转向及对市场调整幅度的低估,未能及时的变换策略,导致其后期业绩持续走低,陷入"成也消费,败也消费"的困局。
广发基金业绩规模十年狂飙 明星基金经理口碑崩塌
近十年广发基金通过打造明星基金经理等营销策略,其管理规模持续走高,2015年,广发基金管理规模在3000亿上下,直到2019年管理规模才一度突破5000亿元,随后开始狂飙,2020年末,管理规模冲到接近8000亿,2021年二季度管理规模突破万亿,到了2021年底,管理规模接近1.2万亿,目前最新管理规模在1.5万亿。
虽然广发基金已成功跻身头部公募基金行列,当前位居公募基金管理规模第三,但随着潮水褪去,广发基金旗下曾经炙手可热的明星基金经理却纷纷跌落神坛。
近期另一位广发基金百亿基金经理卸任多只基金的是邱璟旻,2024年10月,邱璟旻卸任广发优势成长股票基金,任期内亏损超60%,该基金因净值跌破0.4元被称为“三毛基”。2024年12月,邱璟旻卸任广发优势增长股票基金,任期内亏损16%,该基金成立时规模达246亿元,但最终缩水70%。
到了今年1月9日,邱璟旻又卸任了广发聚丰混合基金,在任职近7年时间里,该基金亏损超35%。目前只剩担任广发新经济混合基金经理,该基金规模已不足10亿。
邱璟旻过往管理及在管基金业绩表现,腾讯财经制图
广发基金的基金经理郑澄然也是颇受关注的明星基金经理之一,曾先后任广发基金管理有限公司研究发展部研究员、成长投资部研究员,目前管理规模虽然在百亿之上,但其多只基金业绩已经腰斩,广发兴诚混合基金、广发诚享混合基金、广发成长动力三年持有混合基金任期内均亏损超50%。
郑澄然过往管理及在管基金业绩表现,腾讯财经制图
郑澄然管理基金业绩巨亏主要是因为坚持重仓新能源和光伏板块,未能及时调整持仓策略,导致净值持续下滑,在广发高端制造股票基金吧、广发成长动力三年持有混合基金吧,很多基民晒出了巨亏的截图,有基民要求换掉基金经理郑澄然,还有基民表示后续不再购买广发基金发行的基金产品。
来源:天天基金网
广发基金最为引人注目的基金经理当属刘格菘。2019年,因为押中半导体、光伏、新能源以及医药等热门赛道,刘格菘一举包揽下2019年主动权益类基金前三名,一战成名。随后2020年1月为刘格菘发行了广发科技先锋混合基金。该基金当时出现了“一基难求”的盛况,募集期间的认购金额超900亿元,而该基金的募集规模上限为80亿元,通过新发基金和持续营销,刘格菘管理基金规模一度接近千亿。
刘格菘过往管理及在管基金业绩表现,腾讯财经制图
不过随后刘格菘的明星效应也快速褪去,受其重仓板块回调及投资者赎回影响,刘格菘的管理规模已缩水至340亿元左右,而其备受关注的广发行业严选三年持有期混合基金在近4年的管理期间亏损接近50%。很多高位买入刘格菘管理基金的基民在苦苦等待着解套。
来源:天天基金网
吴兴武是广发基金旗下专注医药领域的核心基金经理之一,2021年三季度末,其管理规模曾达到202亿元,但受医药行业持续调整影响,至2024年末规模回落至百亿以下,缩水超50%,广发医药健康混合基金净值已经腰斩,目前仅为0.48元,有基民吐槽称,“每年收取高额的管理费用,成立至今五年收益率-51%!基金管理人实在难辞其咎。”
吴兴武过往管理及在管基金业绩表现,腾讯财经制图
张笑天是广发基金从外部引入的基金经理,2021年1月加入广发基金,同年5月担任广发沪港深龙头混合基金、广发港股通优质增长混合基金基金经理,曾凭借消费与医药赛道红利创造高光业绩,但后续因策略僵化、风控不足导致规模与业绩双杀,2025年2月10日,张笑天卸任所有在管基金,转岗至其他岗位,广发沪港深龙头混合基金在其任职期间下跌52%,目前已无在管公募产品。
张笑天过往管理基金业绩表现,腾讯财经制图
“基金公司赚钱,基民不赚钱”魔咒待打破
广发基金凭借权益类产品扩张实现了规模跃升,虽然很多只基金业绩巨亏,但其管理费却赚的盆满钵满。
数据显示,2022年广发基金旗下所有基金亏损合计为815.25亿元。而广发基金收取的管理费高达73.56亿元,仅次于易方达基金,在全行业中排名第二。2023年广发基金旗下基金亏损332亿元,收取的管理费仍高达66.55亿元,
以广发基金明星基金经理刘格菘为例,2022年及2023年,刘格菘管理的产品合计亏损高达365亿元,但其依然给广发基金带来了15.82亿元的管理费用。
“基金公司赚钱,基民不赚钱”的困境是行业长期痛点。据经济观察报消息,公募基金改革方案的大致方案已经基本出炉,目前处在优化完善阶段,后续将由证监会正式发布,并征求意见。改革方案(初稿)对于基金经理所管产品的收益率也提出一定要求:收益低于基准10%或负收益,薪酬降50%;强化延期支付和追索机制。
相比基民的亏损,基金公司高管薪酬并不低,2024年5月13日,广发基金公告,公司原董事长孙树明因退休原因离任,葛长伟新任广发基金董事长。公告披露的履历显示,葛长伟曾在广发证券担任副董事长、执行董事,2024年5月10日任期届满离任,广发证券年报显示,葛长伟2023年从广发证券获得的税前报酬总额为222.39万元。
从高光时刻到如今的业绩低谷,除了广发基金的刘格菘等明星基金经理,张坤、葛兰等光环也逐渐褪色,成也业绩,败也业绩。基金公司不应过度依赖“造星运动”,而是需要加强投研风控能力,公募基金行业亦需要摆脱“重规模、轻回报”模式的困境,打破“基金公司赚钱,基民不赚钱”的魔咒。