2025-05-09 08:40:11
谷歌的A2A看起来很美,就不要想得太美了。
大家好,欢迎收听老范讲故事的YouTube频道。
“看起来很美,就不要想得太美了。”这句话哪来的呢?来自于猫腻的小说《将夜》。这个里面有一句话叫:“你长得很美,所以就不要想得太美了。”事情是在哪呢?是在隆庆皇子看到桑桑酒量很好,就想收其为侍女。桑桑呢,是里面的一位女主,而隆庆皇子呢,长得很漂亮,而且身份地位非常高,手持大义的一个人。他提出了这样的一个要求,当时的主人公宁缺就进行了反击,说:“你长得很美,就不要想得太美了。”意思是什么呢?就是保持对现实的清醒认知,你要知道自己是谁,几斤几两。而且呢,也要敢于对强权逻辑进行挑战。
那么,这个事儿跟今天咱们要讲的谷歌A2A有什么样的关系呢?首先先讲一下,谷歌A2A到底是个什么东西。
计算机和软件专家这么多年来呢,其实一直在为一件事情努力。什么事呢?就是让不同的系统,特别是异构的系统(所谓异构系统,就是说你的系统拿C语言写的在Windows上,我的系统是拿Python语言写的在Linux上,他的系统是拿其他什么语言写的在IBM小型机上或者什么这样的),让这些系统呢可以相互之间配合协作,完成一些更复杂的服务。这是这么多年来,计算机专家一直在努力干的事情。
很多的系统都沉淀下来了,你说你把那玩意扔了,让我重写一遍,这肯定不行。所以一定还是要让这个系统为我们大的事业去提供新的热量,不能推翻重干。这些旧的系统呢,实际上里边就都是“屎山”嘛,我们管它叫“屎山代码”。你真要重写一遍,也不是说写不出来,但是你总会丢一点什么东西。现在可能觉得不是什么问题,但是等以后需要找的时候,这个成本就可能会变得很高。你丢掉的这些东西,可能会变得很值钱。这些东西就是能不动就不动。像程序员讲的就是什么:“说我这代码很烂,说能跑不?”什么意思?“说代码跟你有一个能跑就行,要么代码能跑,要么你能跑。”所以能不动就别动这个东西,就要想办法让大家凑合起来,先把事儿做了。
A2A呢,其实也是类似这么一个事儿。它呢是人工智能代理协作的一个标准化方案。现在我们都在玩AI Agent,各种各样的Agent要搁在一起。A2A呢,就是Agent to Agent。它呢定义了统一的通信规则,智能体发现呀、任务分配呀、状态管理呀,我们定了一堆规则来解决跨平台协作的问题。比如说你这是Gemini,那边是OpenAI,Gemini下头还有一大堆的……
什么谷歌翻译、谷歌搜索、谷歌地图,OpenAI后头没准还有一堆office的东西,还有GPT4O画图。等于有一些这样的工具,它们相互之间说:“我们要去聊个天了,怎么能够协作把这事做好?”
我也不惦记说我把OpenAI干掉,你通通都用Gemini;OpenAI反过来也是这样,我也不惦记把Gemini干掉。咱们协作着能够把事干完就完了,各自把擅长的事情做掉。这个事呢,看起来挺美的是吧?
那咱们接着往下说。它呢还挺开放,这个协议。它基于什么样的通信协议呢?是HTTP,也就是咱们浏览网页的这个协议。通过这个协议来走,不要再去定义一些新的私有协议了。
然后,我们使用叫“服务端事件”的这样一种方式,来去确定说对方的服务器干怎么样了。叫SSE,Server-Side Event。通过这样的方式,来确定对方干完了没有,干成什么样了,去决定这个事情是不是接着往前走。
然后呢,让每个智能体写一个叫“智能体卡片”的东西。什么叫智能的卡片呢?就是说你写一个文件说:“我是谁谁谁,我擅长干什么,我在哪个服务器上,我的位置怎么样,你怎么找到我。”大概写这样的一个卡片,然后把这卡片呢找一个地方放好。
当要开始干活的时候,咱把这个卡片都找齐了。有这么多智能体,这个适合画画,那个适合搜索。我们把这些智能体都找齐了,然后现在我们要看一下,我们整个要干一什么事,让各个智能体一起去干活去。
然后还有一些什么状态管理干嘛呢?比如说视频渲染。我现在用AI生成视频了,这挺慢的对吧?你不能让所有的都等它一个。你说:“这边你去生成视频去吧,我就不管你了。”过一段时间去看一下,你的这个状态做完没有。过个5秒钟试一次,过个5秒钟试一次,发现做完了,我再把这个视频拎出来,合到整个的结果里边去。
它呢,通过任务对象,实现复杂协作流程的异步管理。这个话呢是有点计算机专业术语了。这里呢讲一下什么叫异步吧。同步、异步,这是两个相对应的词。
同步的意思就是说,我这边发出请求了,你要给我干一什么事。但是呢,你没干完之前,我站这等着你;你等你干完了,我拿着结果,我再往前走。这叫同步。
异步什么意思?就是刚才咱们讲的,你给我干事去,我就干别的去了。过过一会我再来回来看你,看一下状态对不对。状态变了以后,我再把你结果回收,我再接着去做其他事情。这个就是并行处理的一种方式吧。
所以现在呢,A2A都是可以支持异步处理的。这是目前为止Agent的通讯方面。
定义的最完善的一个协议了。能想到的,没想到的,基本上人全想到了。谷歌嘛,也不是白来的。
现在呢,有三种主流的大模型通讯协议,其实干的活都差不太多。
第一种是Function Calling,OpenAI做的。它呢,就是你把能够做事的工具描述成一个Function,也是用一个描述文件把它描述完了以后,告诉大模型说:“我这有一功能,等你需要的时候你就调就完了。”这是一种方式。
第二种方式呢,就是MCP,叫Model Context Protocol(模型上下文协议)。它呢,是把刚才我们讲的这个描述的过程变成了一个对服务的描述,说:“我这个功能是在哪台服务器上,或者是在本地的一个外部服务器上,怎么去调用,它能解决哪些问题,输入哪些参数,输出哪些参数。”也是这样的一个描述,然后把这个描述扔给大模型,它就干活去了。
那A2A呢,其实干的活也类似。它呢,就是说我们把所有的,甭管是功能也好,还是Agent也好,我们通通都写出卡片来:“我能干什么,我在哪。”然后把这些东西通通都扔在一个地儿,等干活的时候,我们把所有的卡片收集齐了,然后来决定到底怎么去干。
其实干的活都差不太多,只是呢:
– Function Calling必须是在本地进行编程;
– 而这个MCP呢,它支持调用服务器上的东西,可以调用远程的东西;
– 而A2A呢,就是你调用的东西不再仅仅是由大模型调用工具了,它可以在Agent之间、大模型之间进行调用了。它是这样的一个更进一步的协议。
说白了,这三个都差不太多,都是基于JSON的方式将功能描述出来,然后将这些描述呢作为提示词直接扔给大模型,扔过去就完事了。大模型适时调用,就是我需要的时候我就调它,调完了以后呢,让大模型是等在这儿,还是说接着干别的事去,定期来问询,来去确认状态。等收到结果以后,再把结果合并到大模型推理过程中再去干别的。
他们三个的区别就是一个比一个复杂,一个比一个完备,也就差在这了。那你说做的完备,这有什么不好的吗?这不应该把它设计的很完备吗?很多人听了以后说:“老范学了这么多年计算机,难道老想着拿这种半不拉拉的东西就凑合吗?”这个您还真说对了。最后流行起来的各种技术,基本上都是这种半吊子设计的。特别完备的技术一般都流行不起来。
给大家举一些历史上的这种追求完备性的失败的案例吧。这里说的失败呢,并不是说完全没有用起来的这个东西,而是说在未来没有成为主流协议,在大的竞争中失败了。
但是呢,还是有一些单位会去使用的这些方案。第一个叫Lotus Domino,这个呢就是多米诺骨牌那个Domino。这个是1996年出来的东西。IBM当时呢收购了Lotus Notes之后,雄心勃勃推出的系统。Lotus现在估计很多年轻人都没听说过。大家现在使用什么office、Excel这些东西,都觉得很强大很厉害。最早的做类似这种功能的人是谁呢?就是Lotus。第一个在电脑上可以让大家方便处理表格的工具,叫Lotus 123。Lotus也做了类似于Powerpoint、类似于word这样的工具。所以最早做office的实际上是他。后来被微软抄袭了以后呢很生气,把自己卖给IBM了。IBM说这我得替你把公道整回来,我们要让大家一起来继续用Lotus。
Lotus当时还做了一个叫Lotus Notes的工具,不但是把office功能都做完了,还做了很多的协作功能。我现在需要做工作流,我需要做OA系统,我需要在里头有权限,有正常的批文流转,你就可以用Lotus Notes来去实现的,要比office当时还是要领先挺多的。后来到IBM手里来说,我们既然已经可以让这个东西流转起来了,我们要怎么更进一步?他们就出了一个东西叫Domino。你像Domino骨牌嘛,推倒一块,哗啦哗啦要一一直这么往前走,起这个名字也是为了这个。它是最早期的群建解决方案,就是说可以把各种的信息都包装起来,支持分布式的数据库和安全机制。我的数据库不一定都要存在一个地儿,我可以存在不同的地方,相互之间配合来工作。曾被视为办公自动化的标杆,当时也是觉得非常非常强大。我当时还学了好长时间呢,学这玩意说这东西实在太厉害了,比其他的这些都要强太多了。因为各种你能想到没想到的,它全都给你做出来了。
但是就遇到了很多其他的问题。第一个是对于复杂系统的二次开发成本和部署、培训成本实在太高了。你要想开发这个系统,你必须要先去问说有几个处长,谁审批什么事,大家是怎么流程,你要先去干这个事。而且整个开发完了以后,你还要培训人家怎么使用。整个都做完了以后呢,下一个问题是什么?你业务不能变。你只要业务开始发生变化了,有迭代了,你刚才花的这些成本再来一遍,这个是很麻烦的。而且呢Lotus Domino有一个很大的问题是什么?它不支持Windows。IBM当时在推一个东西叫OS 2。IBM为什么去收购Lotus?
Lotus Notes回来要去跟Office打一仗呢,不服气。我是花钱找比尔·盖茨去开发PC DOS,后来又花钱去找比尔·盖茨去开发OS/2。结果比尔·盖茨呢,一边拿着我的钱去给我开发OS/2,还给我拖进度;一边自己偷偷把Windows做出来了。Windows把我的OS/2打得满地找牙,我不服气。我要找一个跟我补齐短板的东西,一起去把Windows跟Office重新战胜它。OS/2也没有打败Windows,Lotus Domino也没有打败Office,大概就是这样的。
而且IBM还干了一个什么事呢?它全套使用自己的解决方案和开发工具。你要想集成一些第三方的拓展,也是很麻烦的。最后呢,是被微软的Exchange和Office打败了。微软Exchange实际上是一套功能很强大的外部服务器。这是我们讲的第一个案例。
第二个案例是什么呢?叫SOA。这个东西呢,叫服务导向架构(Service-Oriented Architecture)。2000年左右开始推出,谁在后边推呢?Sun、IBM和Oracle。它是基于当时的J2EE架构。它什么意思呢?就是当时大家都是用Java去开发各种各样的业务系统。这些业务系统呢,你要让它跑起来,要让它相互串起来。比如说你开发了一个库存管理,我开发了一个电商系统,那边开发了一个物流系统。我们怎么能够让系统整个转起来呢?我最好是写一个我们叫企业服务总线,在这个上面把这个物流系统、仓储系统、电商系统串一块,这个事不就跑起来了吗?你们那系统我们就不用改了。
这个当时其实也是一个非常美好的愿景。它呢,支持跨语言、跨平台的服务调用,推动企业应用集成的规模化落地。你们原来都已经花了好多钱了,做了一大堆的这种子系统了,我们现在给你串起来,干这样的一个事情。他干这个事跟刚才咱们讲那个Lotus Domino有一点点像,只是这一块呢要更先进一些了。但最后也是失败了。
失败的原因呢,是服务编排依赖集中式治理,难以适应敏捷开发。大家都做好了以后,我们现在要给大家串起来。但其实是真的是每一个提供的服务接口后边都是一个屎山,光看所有的这些文档都看不过来。现在想规划各种新的业务,只能在屎山基础上再叠加屎山,最后就变得越来越复杂。这是第一个错误原因。
第二个呢,过度依赖于一些特别复杂的重量级标准。比如说里头有一个叫WSDL,这个标准呢叫Web服务描述语言。
Web service description language 就是我们要发现你的服务嘛?你这儿做了一个服务怎么办呢?你要写一堆的文件,让我去调用的时候可以去发现你。我们现在做很多的类似这种工作,都要做一个叫自解释。
我这有一个仓储管理的系统,这个仓储管理系统到底应该怎么用呢?你应该调用以后,你就出一个类似于文档式的东西,告诉你要怎么怎么调用,我使用什么样的权限,要把这东西都写在文档里,或者说写在一个说明的服务里面。就是你要调用这个服务,然后我来给你说明,我给你讲清楚,你才来个调用,要有很多这样的东西在里头。
然后呢,还有一个很重的协议叫SOAP(简单对象访问协议,Simple Object Access Protocol)。你也要描述说,我这个对象到底是怎么回事,它等于有一大堆这样的协议在里头。最后调用起来就非常非常麻烦。而且你想他这些东西,你也要把改造原来那个系统。以前你这有一个仓储系统,肯定是不支持什么WSDL和SOAP的,你得改造这个东西。
最后说我们懒得动了,或者说这个系统人家已经交付了,钱都付完了,我现在再去找人弄,没人理我了。所以最后也没推起来。最终呢,这个是被微服务架构给替代了。不要做这么复杂,不要做这么重,独立部署和轻量化的通讯,最后替代了这种SOA的系统。
现在我们正在使用的各种Restful。Restful是什么?就是说我也不用去说明你这个服务到底是怎么回事,我只管调用,调用完了以后,得到一个Json的返回结果就完事了。我们现在使用OpenAI的ChatGPT,使用Gemini,使用所有的这些网上服务的调用API接口,实际上都是Restful。这个就要简单很多,不需要这种自解释。
这是第二个失败案例。第三个失败案例呢叫Sharepoint。这个东西是2006年微软推的。微软说我这有office,有Windows,还有这么复杂的权限系统,大家进到我的Windows系统里头去,谁有什么样的权限我都管好了。我也想打造一个企业级的内容管理和协作平台,文档、门户、业务流程我都给你整合在一块。你们不要再去折腾找人买OA系统,找人再定制开发,别干这事了,我都一站式给你搞定。
我们以前写OA系统的时候,有一个很头疼的点是什么呢?就是我们需要处理office文档。你做了一大堆的各种流程,最后你还是要在office文档里去干活。微软说干脆我自己弄吧。
就整了这么一套东西出来。SharePoint这个东西,我也是参加过培训,还折腾了挺久。最后呢,也没有太大用起来。
它呢,深度集成了Office套件,提供了开箱即用的文档、版本控制和工作流引擎。比如说,你这儿是财务系统,我这儿是销售系统,那边是一个HR的系统。我们自己做自己的文档管理,别人想到我们的财务系统里去看一下财务的各种规章制度、一些相关的文件,根据他的权限就可以进来找了。它的这些功能都是完整的,听起来也是头头是道的一套系统。
最后呢,也是没玩下去。用户体验极其僵化,界面复杂、定制化依赖代码开发。你要定制这东西,你还是得写大量代码,非技术用户基本上没办法进行自我配置。而且它的生态碎片化非常严重,第三方插件兼容很差。企业需要投入大量的资源维护定制化功能,因为每一个企业都有各自的需求。这块对于SharePoint系统来说,基本上就是地狱。
最后替代的技术是什么呢?Slack。我们也别费劲了,你也别研究说谁有什么权限或者什么样的,咱们直接上IM,大家聊天就完了。需要的时候就直接把文件丢在里头,就传过去了。国内呢,就是像什么钉钉、飞书、企业微信,这些系统就把它替代掉了。微软呢后来说,我也不再推SharePoint这样复杂的、完善的东西了,最后做什么?叫Microsoft Teams。咱们在这个里面聊天传文件就完了,别搞什么权限管理这么复杂东西。
那么这些项目都是怎么失败的呢?咱们讲到这么多项目。第一个呢,就是这些都是大厂推的。咱们刚才讲的这三个案例,一个是IBM的,第二个是IBM、Sun、Oracle的,第三个是微软的,都是大厂在推,而且都是花了大钱在推。这3个都是请讲师讲课、出书、组织培训,我都参加过培训,也都买过书、都学过,而且非常完善,看起来都很美。他怎么能失败呢?
第一个是默认需求和各个组件的能力是固定的,要干什么这事就一定是定死了,不许改。第二个呢,就是每一个组件到底能干什么也是确定的,不允许有什么变化。这是他们这些系统在设计之初就已经埋下的雷,所以他们应对各种变化、应对第三方的这种接入,都是非常麻烦的。
那你说我们的系统就是很复杂,怎么办呢?他们解决的方法呢,都是通过增加复杂度来应对各种灵活性问题。你想把这东西变得稍微灵活一点,可以,没问题,我们增加一点复杂度,写点程序是可以搞定的。但这件事呢,你肯定是越往后复杂度就越高,那你最后里头堆积的屎山代码就越多。
最后,这维护性就越来越差嘛。而且呢,做类似这种协议里头,还有一个很大的问题是什么?私心太重。就像刚才咱们讲那个隆庆王子的故事似的,他想要人家女主回来给自己做侍女,都是有私心的。那你说这些大厂能有什么私心呢?都是想捆绑自己家的服务。一开始IBM说我不上Windows,我要上OS/2,这不是捆绑自己的东西吗?后边Oracle、IBM和Sun去推SOA的时候,他们都是卖小机的,卖中间件服务器的。你一旦走了这条路,大家就一定要把它这个全套系统都买齐。所以肯定还是说店家推自己的东西。至于最后这个Sharepoint,那微软说你得买我的操作系统,你买我的Office,一套都买齐了,你不要用别人任何东西。大家私心都很重,所以第三方技术很难兼容进来。
这种技术应用,刚才咱们讲了不是说没人用,也有人用。但是呢,它有一个很大的前提,就是需要有自上而下的需求,由最上面开会来决定这事要这么干,一层一层讨论,从上往下布置。这个事是可以用起来的。上层决策者呢,通常喜欢大厂,也喜欢相对比较完善的方案。举个例子吧,比如日本。日本的IT企业一般都是自上而下决策的。刚才咱们讲这三个技术:Lotus Domino,部分制造业企业比如丰田,早期用于内部的OA系统,依赖定制化开发。但是因为维护成本实在太高,后来还是被淘汰了,因为你不支持Windows,这事咋弄?没法整。SOA,日本的金融行业,比如像三菱的UFJ银行,曾经通过这个SOA进行整合过。但是因为架构僵化,难以支持移动端创新,近年来逐渐转向微服务,还没有彻底转干净。当时做SOA的时候,还没有移动互联网呢,所以没想到过这个问题。Sharepoint,政府机构比如说总务省用于文档管理。但是因为界面实在太不友好了,协作效率实在太低,现在已经逐渐被Google Workspace取代了。
走这条路呢,基本上就退出了创新迭代的第一梯队。最上面这个老板,他也是信息茧房,并不知道一线的人每天在遇到什么样的事情。由他去拍脑袋决定,下边人只管执行的这种模式,不是说这东西就做不好。但是呢,四平八稳的,所有新东西跟他没关系。通过这种方式呢,日本失去了它的互联网和移动互联网时代。现在在AI时代面前呢,也在踌躇吧,大概是这样的一个状态。
总结一下,A2A协议的设计逻辑呢,与历史案例中的很多失败范式高度相似。试图通过顶层设计解决复杂的协作问题,却忽略了技术演进。
{的动态性和生态多样性。当前Agent的核心其实还是大模型,而大模型本身的能力边界还非常不清晰,依然在快速扩张之中。这两天,谷歌Gemini 2.5又升级了,现在升级到Gemini 2.5 Pro 0506版,也就是5月6号这个版本,又遥遥领先了。这次是真遥遥领先,特别是在编码这一块遥遥领先。
那你现在都已经到这样了,你说你做一大堆A2A,把代码写进去了以后,你发现大模型升级了,你咋弄?你根本没法整这个事。所以,A2A的未来呢,充满了非常大的不确定性。作为现在的一些新的程序员,或者是一些新的技术人员来说,这种系统出来呢,还是值得学习一下的。但是,不建议大家在上面投入太多的精力,把一些很重的系统直接搭建在类似这样的协议上面去,未来转向会比较麻烦的。
好,这个故事今天就跟大家讲到这里。感谢大家收听,请帮忙点赞、点小铃铛,参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见!
2025-05-08 08:40:54
川普使用的山寨版Signal被黑客破解了。世界真的就是一个巨大的草台班子吗?
大家好,欢迎收听老范讲故事的YouTube频道。这个槽到底要从哪开始涂起呢?实在是有点难。从这儿吧:5月4号,黑客向404 media发布了消息,仅用了20分钟就破解了特朗普政府高官们所使用的Signal服务器,并获取了聊天记录和登录凭证,还利用这些登录凭证向加密货币讨论群发布了一些测试消息。
更大的槽在后边呢。Signal官方回复说,特朗普政府高官们所使用的并不是官方正式版本的Signal,而是一家由以色列退役军人组建公司魔改过的山寨版的Signal。Signal本身是安全的,没有问题。Signal基金会多次强调,川普他们所使用的这个东西叫TM SGNL,或者叫telemessage Signal,非官方应用未获取技术授权,且无法保证其安全性。人家警告过好多次了。
结果是什么呢?就是特朗普政府高官们使用的是以色列军方模改的Signal,他们的聊天记录都是用明文存放在TM SGNL的服务器上的。这些服务器被20分钟破解,破解完了以后直接把明文的聊天记录和他们的登录凭证给拖回来了。这个版本不被Signal官方所承认,黑客可以轻松破解,并且把它们扒了个底儿掉。
事情就是这样的一个事情。那么这个事是怎么开始的呢?大家还记得今年3月份吗?2025年3月24日,美国大西洋月刊的主编杰夫里格德伯格被意外拉入了美国高官们讨论问题的Signal群。时任美国国家安全顾问的迈克尔沃尔兹在创建该Signal群的时候,误将杰夫里格德堡加入了群聊。
迈克尔沃尔茨呢后来被审查,离开了国家安全顾问的这个职位,被重新安排成为了美国驻联合国的大使。特朗普还算是个念旧的人,并没有为这个事就抛弃他。结果到4月30号,一名路透社摄影记者在白宫内阁会议上拍摄到了沃尔茨的手机,屏幕显示他使用的是一个名为TM SGNL,一个非官方的Signal的应用。这是一款由以色列公司telemessage开发的Signal改版客户端。
沃尔斯使用telemessage曝光之后不久,一名黑客瞄准了telemessage公司的后台系统,实施了入侵。独立科技媒体404 media于5月4日首次披露了这一黑客攻击事件,说利用已知漏洞攻击了TGSGNL服务器后台,所有聊天记录备份都是用非加密的明文存储的。
5月5日,路透社、TechCrunch等权威媒体也证实了提供修改版Signal的Telemessage公司遭到黑客入侵,其存储的敏感资料被窃取。这就是事情的始末。
从三月二十几号,《大西洋月刊》这位总编错误加群那开始的。然后,这位迈克尔·沃尔茨去了联合国当大使以后,被摄影记者直接拍下来,手机上用的居然不是官方版的。这个事情被曝光了之后,引起了黑客攻击,结果20分钟就把东西拖回来了。
Signal到底是一个什么样的软件呢?Signal这个软件现在大概有7,000多万的活跃用户。当然,在3月份《大西洋月刊》的总编加入到Signal群聊之后呢,这个数字在暴涨。一帮人说这是什么神奇的软件,我也要去试一试。
这个软件呢,是号称现在最安全的聊天软件。因为呢,它使用端到端加密,而且呢,它免费不要钱。包括我们在上面去打电话、电话会议都是免费的,里头也没有任何广告。它是一个非营利组织,靠Signal基金会来运营,完全靠大家的捐赠。它没有任何商业的东西在里头。
Signal通过了很多国家和这种安全机构的安全认证,因为它所有的系统都是开源的。你可以拿这个东西去做检测。它现在应该是通过各种安全认证最多的安全聊天软件。
它呢,最早的研发者应该是美国密码学专家莫克西·马林斯派克。这个莫克西·马林斯派克在2010年呢,推出了两个工具:用于加密短信的TextSecure和用于加密语音通话的叫Red Phone(红电话)。并且呢,把这两个协议组成了一个系统,叫Whisper System。
2011年呢,这个Whisper System呢被Twitter收购了。当时并没有公布价格,应该钱不多,我估计可能也就是200万美金以内的价格把它收购了。Twitter呢,将TextSecure和Reddit这两个协议就给开源了。
莫克西在Twitter工作了14个月之后,放弃了100万美金的股票,离开了Twitter。这个数字呢,我们可以猜测当时交易的价格。我以前也做类似这种收购,这个收购的过程呢,一定是股票占大头,现金占小头,经常是80%的股票,20%的现金进行收购。
所以呢,他放弃了100万美金的股票,他整个的收购呢有可能也就是一百几十万到两百万美金。因为他已经在Twitter工作了14个月了,所以有可能是成熟了25%的股票。像我们以前收购的时候,比如说100万的股票分4年,每年成熟25%。
所以他有可能成熟了25%,再加上可能配的一部分现金,所以应该他的收购价格是在200万美金以内。具体的数字呢,因为人家也没公开,咱们只能坐在这猜。但是有一点是确认的,就是莫克西呢应该通过这一笔收购,并没有挣到什么钱。
莫克西·马林斯派克离开Twitter之后,继续维护开源的TextSecure和Redphone这两个协议,并且利用这些协议开发了Signal这样的一个软件。2018年,Signal转型为非营利组织Signal Technology Foundation(就是Signal技术基金),获得了WhatsApp的联合创始人布莱恩·阿克顿1.05亿美金的捐款。
这个布莱恩·阿克顿呢,他的经历跟前面这个莫克西很像,都是自己开发了个即时通讯的应用,然后被大厂收购。只是有一点不一样,是什么呢?就是布莱恩·阿克顿他是挣到钱了,因为他在WhatsApp里边占20%的股份。而Facebook当年是用多少钱收购的WhatsApp呢?190亿美金。这190亿美金算到布莱恩·阿克顿手里头,应该是38亿美金。就算这38亿美金并不都是现金,里头可能有大量的是Facebook的股票,那你想到现在Facebook股票又涨了这么多了,所以这哥们手里边的现金或者现金等价物的价值,可能已经超过四五十亿美金。这样的一个人直接捐款,说来我们一起来继续把这事做下去。
那么Signal的安全性到底是怎么来的呢?它使用的呢叫非对称加密。所谓的非对称加密,就是一个公钥一个私钥。私钥留在本地,公钥呢是用来加密的。在我们进行信息沟通之前,我们相互之间把公钥发送给对方,而且公钥是一个明文的。对方会把自己要发的信息用公钥加密,加密完了以后把密文发给我,我呢用私钥把这个密文重新解开,是这样的一个方式。
而Signal的话也是如此。我们两边要去发信息了,我给对方发一个公钥,对方给我发一个公钥。相互之间把各自要发的信息通过对方的公钥加密了以后发给对方,然后对方用私钥可以把它解开。这个呢就可以保证你在服务器端无法备份,而且服务器端也不知道大家在说什么,因为服务器端没有私钥。你就算是你截获了对方的公钥,你加密了以后,你想把它解开,你解不开,必须要拿私钥才能解开。而且呢因为Signal呢使用的是短时间的私钥,每发几条以后他要换,就算是你截获了一个私钥了,虽然这个私钥不在网上传播,甭管他是怎么获得的吧。
比如说,我通过拿到你的手机,然后把你的手机破解了,我拿到私钥了。哎,也没事。后边再去发消息的时候会产生新的私钥,它通过这种方式来保证它的安全性。所以呢,它的服务器上肯定什么都不能存。
完全免费,依靠捐赠生存。他现在每年的费用都是公开的,因为是捐赠嘛。2024年的话是4,000万美金的成本,把它烧完就完了。2025年的话,他们预计是要花掉5,000万美金的成本。在这个过程中,大家还是要不断的去给他捐赠。
除了前面我们讲布莱恩·阿克顿之外,还有很多什么自由新闻联盟,或者是各种的这种软件基金会,都会给他们捐钱。包括前面这个Twitter,莫克西离开Twitter的时候放弃了100万美金的股票。Twitter的创始人杰克·多西每年会向Signal基金会捐赠100万美金,每年往里捐,每年往里捐。他是这样的一个运作方式。
还有很多人呢,是用非具名的方式往里捐钱,所以他们完全是非商业运作的。这个软件开源,甭管是它的后边协议也好,还是前面的软件也好,都是开源的,接受第三方的安全检测。你说这东西到底安不安全?你自己测去吧,反正我所有都开源,你拿源代码去测就可以了。
WhatsApp也是使用的Signal的安全协议,但是因为WhatsApp是不开源的,而且呢WhatsApp后台是Meta的,所以Meta还是可以得到你一些信息。而对于Signal来说就是我就没有后台,我也不存你的什么通讯录、对话记录,什么通通都不存,所以它是最安全的。
那么Signal的安全性到底是怎么来保证呢?第一个就是它的技术原理,这个东西是安全的,保证没问题。第二个呢就是它的分布式架构,我服务器上啥也不存,你们都是各自手机上存就完事了。所有关键信息都存在各自的手机上,而且开源,我们接受所有人的检测,你们自己去试,去非商业化运作。因为你一旦商业化运作,那他有时候就说,我是不是在里边应该推点广告,怎么能提高广告命中率,就没有那么安全了。所以Signal本身的安全性就是这样来去保障的。
那么讲回来了,Signal这么安全,那你特朗普政府这帮人,你就直接使Signal不就完事了吗?你为什么还要去使用telemessage Signal这样的一个产品呢?原因也很简单,这个Signal刚才我们讲了,它是不提供聊天记录备份这功能的,因为它为了保证最大的安全性,我就不存。我在服务器端,我也不知道你在说什么,你也不要来问我。
它是这样的一个工作方式。咱们举另外一个案例,你比如说像Telegram。Telegram号称也很安全,但是它在服务器端,它是存这些聊天记录的。那么就会发生什么问题?就是Telegram的创始人到法国,直接被人抓住了,说你必须要把里边的信息给我交出来,你不交出来我就怎么怎么样。最后他就没有办法,只能把他交出,因为他存了吧。那你就可以去抓交这个东西。
那Signal这个你就算把他抓住也没用,我没存。你抓住我,你打死我也没用。但是呢,对于美国政府来说,它有一些合规性的要求。你比如像美国总统,它所有发出的信息都是要存档的,你不能说我发完了以后这事没了,这个是不允许的。那么Signal它就不符合美国政府所要求的这个合规性。那他说我们找一个吧,找一个能够提供聊天记录备份功能的Signal。美国政府他就想办法去找去了,找到了一个折中方法。有一个叫Telemessage Signal的一个产品,它是提供备份的,而且呢他们收钱。这个Signal刚才我们讲了,它非商业运作,它不收钱。美国政府说我给你交钱,你给我做一个提供聊天备份的行不行?人家不理你,人家是一个非营利机构。
美国多个联邦部门,比如说国土安全部、卫生部、财政部、国际开发金融公司等等,就跟Telemessage的母公司SMARSH签订了正式的采购服务合同。我花钱,我向你买。这个TM SGNL呢号称是跟Signal拥有完全相同的安全属性,但是我还给你加了聊天记录备份的功能,还可以进行事后的监督。而且这里头还有一个问题是什么呢?就是TM SGNL跟Signal是完全互通的。你用TM SGNL可以加Signal的好友进来,Signal呢也可以跟TM SGNL里边的这些人去聊天。这是一个很神奇的事。
原来是比如说我政府内部,我去采购一个什么东西,你应该有一套独立的用户系统。你这个用户认证系统应该是跟外边相隔离的,这就不会出现前面我们讲3月24号美国大西洋月刊主编直接被拉进群这种事。因为它就直接在Signal这个基础上改的嘛,所以两边通的。只要名字相同,就直接把人拉进来了。那这事就没法整了。
所以这个故事呢,就这么顺理成章的下来。Signal是世界上最安全的,到目前为止依然是。为了讲今天这故事,我还去下载了一个Signal,虽然没有任何Signal好友,也没有在里边聊天,但还是要起来试一试的。但是它这个东西怎么说呢?
确实没那么好使。你跟Telegram呀,跟Discord呀,跟WhatsApp和微信比起来,确实没有那么好用。从安全性上来说,它等于是最安全,但是为了安全性,它把其他所有的易用性、什么功能全都牺牲了,就是这样的一个东西。
美国政府为什么他一定要使用这玩意呢?因为这一届的美国政府是一帮B圈大佬。甭管是特朗普还是其他的一些人,都是一帮玩B圈的。B圈的人呢就喜欢玩Signal,因为他们觉得这东西最安全。我们在里头去交流一些哪个涨了哪个跌了的这种事,很安全。说我一定要用这玩意,下边人说那我们就去找一个折中方案吧。结果以色列军方一帮退役军人就给他们做了这玩意。那你说这东西后边有没有以色列军方的影子?这事没法说,这属于一个阴谋论。他们至少真退役了吗?因为像我以前在安全公司的时候,我们也跑到以色列去,去投资他们的很多安全项目。以色列这帮公司在安全项目上做的是非常好的。
而且我们投资他们也很简单,就是你在以色列安全部队里头混没混过。你确实拿出履历来说,我原来是以色列内部专门做安全这个部队里边的一个军官。你是个中尉,是个少校,还是一个什么样的,你拿出来就投。我们也不管你到底是做过什么,你只要拿出正确的履历来就会去投。所以这个TM SGNL估计也是这样去组成的。那你说这些人以后是不是会把美国政府聊天的记录直接给以色列军方去看,给丽塔尼亚福去看?那咱不知道,这个事只能当阴谋论去看了。
这个TM SGNL整个做的过程呢,又没有那么安全。你想TM SGNL它要给人做聊天记录备份,你就必须要备一个回头能够解密的版本。你不能说我备份了,拿下来以后我无法解密了,不知道你原来备份了些什么东西,这事肯定不成。他就要在服务端去存这个东西。那你存的时候呢,最简单的就是存明文嘛。我传的时候可以去加密,但是我存的时候要存明文,就是这样的一个方式来去工作的。
但是他在服务器端呢,又稍微有点草台班子。很多互联网上的这种已知漏洞并没有修补。所谓服务器也就是说,我在Linux的云主机上整了点什么事情,这上面漏洞多去了。这帮安全军官们也是说我挣钱就完事了,很多安全上的事情并没有那么特别在意,事情就出来了。
那么结论,这个世界真的就是一个巨大的草台班子。最新的技术呢其实并不在政府手里面。但是政府原来不怎么出事的,原因是什么呢?他通过一些制度来管理这个事,就是大家是封闭的。我这个政府里边的这个系统……
你必须使用比如政府邮箱认证,或者是使用政府内部的一个独立的认证系统,来认证他原来是这么来工作的。
外界的很多黑客呢,有时候也未必说我就愿意去破解这个玩意。因为第一个用的人少,第二个我破解了以后,未必能够获得多大的利益,还要承担巨大的风险和刑事责任。这样的这种成本,所以一般人也懒得去理他。那么政府的系统就这么一直摇摇晃晃的就晃下来了。
结果特朗普政府来上来了,一帮b圈大佬说我们要用Signal。他们自己有一些固有的技术偏见,Signal到底是怎么回事,我估计他们大部分人也不懂,但我就要用。这些人就去影响政府采购去了,说我要用,你们去给我买去吧,别的东西我不使。这帮政府采购人员说那我去找吧。Signal自己不收钱,我拿人家没办法。Signal还不支持备份,这个不合规,我们要找一合规的,就找到了TM SGNL这样的一个公司。
那TM SGNL这帮人呢,就是投其所好。美国政府要买嘛,那我就挣这份钱。而且TM SGNL一直没有得到Signal基金会官方承认,说他使用我的技术,压根就没有得到我的授权。他也没有向我捐钱,你按道理说你使用人技术,你好歹你捐点呗,人家也没捐钱。就这样的一个状态,两边就互相看不对眼,就干上了。
这帮TM SGNL魔改了一把,人家真正安全的Signal就中标了。这帮黑客一看说哦,你居然拿Signal的东西去做服务器了,那我总要上去看一下吧。我们好奇嘛,上去看一看,结果发现20分钟就进去了。进去完了以后直接把库就拖出来了,大概就是这样的一个情况。
这个世界呢,真的就是一个草台班子,还会给我们带来更多的欢乐。这就是今天这个故事。好,感谢大家收听,请帮忙点赞,点小铃铛,参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
2025-05-07 08:41:35
世界最大的汽车滚装船落户比亚迪,全球汽车市场颤抖吧!
大家好,欢迎收听老范讲故事的YouTube频道。今天咱们来讲一讲比亚迪深圳号正式交付,开启首航。这条船呢,4月22号在江苏仪征正式交付,由招商工业南京金陵造船厂建造。4月27号晚上,深圳号搭载了7,000辆比亚迪新能源汽车,从江苏太仓港出发,前往巴西伊塔雅伊港。
这是世界上最大的汽车滚装船了,总长219.9米,宽37.7米,设计吃水9米,设计航速18.5节,可以装9,200辆汽车进去,总排水量7万吨,造价6亿人民币,不到1亿美金就可以造一艘这样的船。单次航程成本是736万到930万美金。通过模块化建造,建造周期压缩至18个月,较传统工艺缩短25%。30天就能够把比亚迪汽车运到巴西去。巴西基本上算是从中国出发可以跑到最远的地方了。所以呢,这条船基本上是30天之内可以把车从上海或者是江苏运到全世界任何一个地方去。
这是现在最大的汽车滚装船。那第二大的是谁?也是招商重工建造的,可以装9,100辆汽车的滚装船,叫里诺极光号,这是给挪威里诺造的。
这条船(深圳号)呢,使用的是LNG,也就是液化天然气双燃料技术。它呢可以烧重油,也可以烧液化天然气。同时呢,也为甲醇和氨燃料做了预留设计,稍微修改修改这个发动机,也是可以烧甲醇燃料的,算是环保船吧。
比亚迪呢也很有参与感。比亚迪进去掺和了什么事呢?作为全球首艘搭载比亚迪固定式厢式储电池的货轮,它实现了类似新能源汽车的混合动力驱动模式。在港口作业或者是低速航行时,可以完全依靠电力驱动,实现了零排放运行。船上安装了比亚迪厢式电池组,不仅提供了辅助动力,还能回收利用主机余电,实现了能源梯级利用。所以这是一条混动船。
电池组大概可以装几百辆汽车的,采用的是LNG双燃料与纯电切换技术,结合自研的厢式电池组与轴带发电机。低速航行时可以切换纯电模式,碳排放较传统的燃油船降低30%,形成了新型的绿色能源动力。
它呢有智能的能效管理系统。你像咱们混动车也是智能能效嘛,什么时候走电,什么时候走油。所以比亚迪就把这套技术也搬到这条船上去了。另外还做了空间利用优化,估计多出100辆车的这个位置。就是比亚迪在里边再倒腾倒腾,这儿多放两辆,那儿多放两辆,多放了100辆车。所以它是9,200辆,比那个9,100辆的要稍微多放一点。估计船壳都基本上是一样的。
那么汽车滚装船……
这个车是怎么装上去的呢?其实呢,这个汽车滚装船就是一个可以在海上航行的巨大停车楼。车是从底下(岸上)开上去的,一辆一辆开上去,里边就是一层一层的停车甲板。等你开进最底层以后,它就把下去这个坡道升起来,等于这个坡道上又可以停几辆车。你正常的停车楼,这个坡道是固定的,但是船上呢,肯定是你需要往最底下停的时候,这个坡道降下来;等你不需要往这层停车的时候,它就可以把这个坡道拉起来,又可以多停几辆车。停满一层,再把上一层的坡道再拉起来,又可以多停几辆车。基本上是把9,200辆车一层一层的停到这个船上去。所以这东西装船卸船还是挺麻烦的,你得顺序的把车开上去,再顺序的把车开下来。
每个车位四个轮子的这个位置呢,都有固定孔。车停好了以后呢,需要拿捆扎带把它捆上,这样这个船在海上开的时候,遇到风浪不会在里头晃来晃去。你车一旦在里边晃来晃去,就有可能发生剐蹭碰撞,那也还是挺麻烦的。而且这种船有一个很麻烦的什么,就是要严格的进行防火和隔离。那里头装的是9,200块动力电池,如果装这个比亚迪的电动车的话,这个有一辆车着了,估计这整个船就废掉了。所以他们还是要做非常严格的防火,所以这个还是要进行专门的设计的。
那比亚迪造这条船目的是什么呢?就是用自己家的船比租船要划算。运一辆车的成本是800-1,000美金,如果租船的话,运一辆车的成本是1,400美金,要贵很多。大家要注意,你多出这个几百美金来,这是要交税的。什么意思?我们算价格的时候呢,有一个叫FOB价,有一个叫CIF价。FOB呢叫离岸价格,CIF呢叫到岸价格。到岸价格就是你这辆车的价格,还要加上运费。你收税的时候是按照到岸价格来收的,所以这个1,400美金,你比如说把它拉到美国去了,美国说我要给你征145%的税,那多出这一几百美金的运费来,也是要征这个145%的税的。所以,这块如果能够省一些的话,对于整个比亚迪来说,还是可以省蛮多钱的。
比亚迪的船队呢还在不断的扩大。深圳号呢是他的第四艘船,第一艘叫开拓者1号,头一艘嘛,咱们起个好名字;第二艘叫常州号,然后是合肥号。前三艘呢都是可以每艘装7,000辆车的,没有深圳号这么大。深圳号是第4艘,后面长沙号是第5艘,也是9,200辆车的,本月交付。第六艘呢还是7,000辆车的,是由广传国际来建造的。这条船呢是主要跑东南亚和南美的一些航线。第七艘跟第八艘呢,都是这种9,200辆车容量的新船。
是由招商局重工来建造,2025年下半年都是可以交付的。截止到2025年年底,全球滚装船的运力就已经过剩了。就到2025年年底,把这些船交完了以后,大概能过剩10%。这就是中国玩家的玩法:先预估一下全球的需求量,一次把这个所有量给它造满。产能过剩之后,咱们来选价格。
现在世界船队的格局是什么样的呢?老大是日本。日本三大航运公司,NYK、MOL,还有一个叫KLINE,他们有250到300艘汽车滚装船。但是他们的船要稍微小一点,7,000辆的或者是8,000辆一艘。他们呢,占了全球汽车运力的40%,因为日本每年也要出口大量汽车,也是需要运的。
挪威呢,是老二。挪威华伦威尔森航运,78艘。现在呢,正在亲临造船厂,造这个叫Shaper级的新船,用甲醇燃料。明年交付这条船的话,是可以装9,350辆车的,又比这个9,200辆车的要更多一些了。
老三呢,是挪威里诺航运。他们现在有30条船。前面我们讲的里诺极光,9,100个车位的招商重工建造的,就是他们家的。
老四呢,叫中航海运,26条船。到明年呢,可以有30条船。特斯拉上海超级工厂的车,都是由他们运的。
现在比亚迪航运来了哈,到年底有8条船,还算是个小弟弟。但是呢,也算是肥水不流外人田。以后比亚迪自己的车,我们自己运,不求人了。
中国到底出口了多少车呢?这么多船运的过来吗?2024年,咱们只计算整车,中国一共出口了是640.7万辆车。这640.7万辆车里头呢,512.6万辆车,也就是80%呢是走海运的。128.1万辆车,20%呢,走陆路运输。陆路运输呢就是去俄罗斯、中亚五国。还有大概十几二十万辆车,是通过中欧班列直接去欧洲了,去德国,去法国了。
所以,如果是俄乌冲突停止的话,会有更多的中国汽车可以直接通过中欧班列运到德国去。
这些车都是哪的呢?奇瑞生产。奇瑞出口了114.4万辆车,但主要呢是燃油车。上汽呢,是92.9万辆,包括它的一些子品牌MG、MAXUS,这些子品牌都是上汽出口的。长安53.6万辆车。吉利呢,是53.2万辆车。长城呢,出口了45.3万辆车。长城的车我估计很多都出口到俄罗斯去了。比亚迪呢是43.3万辆车,但是比亚迪主要是新能源车。
你按这样来算,43.3万辆车,80%海运。一条船一年可以跑6趟,30天去30天回来吧,跑6趟跑满了。它8条船的话,一除大概每条船7,000辆左右。所以呢,真的是卡边掐牙。
一点都不太富裕的这8条船,也许明年比亚迪还会继续扩充他的船队。北汽出口了27.4万辆车,特斯拉呢是26万辆车,主要是model 3。以后呢,可能会出口一些model y出来。
那你说用船运和在当地建工厂,到底哪个更划算一些?如果是短周期,就是3年之内,一定是拿船运更划算,这个没什么好说的。因为你要在当地建一座中型的工厂,还不要说造大的工厂,这个成本大概够造24条船的。所以肯定是造船要更划算一些。三年的话基本上能把这条船的成本可以挣回来,这个船还是挺挣钱的。
而且呢,中国的供应链还很集中。我就算是跑到比如墨西哥呀、匈牙利呀、土耳其这些地方,我去建工厂去了,你还得把零部件运去呢,这个很麻烦的。你在中国整个都把车一次造出来,这个还是非常的方便的。而且中国的技术工人的熟练度、技术工人的数量,以及工资和管理,就中国技术工人还是比较好管理的吧。就这一块的话,你在外边建工厂肯定是不划算的。
当目标市场的关税超过15%以后,在当地建工厂才划算。如果是低于15%,你就老老实实拿船运去就完事了。建厂的周期的话,肯定要比造船要长很多。你想造一条船18个月,如果你一把把钱砸进去,一下砸24条船的成本进去,相当于一个工厂的钱吧。过18个月你就剩了24条船,再过个几年,你可能就把这船的成本都挣回来了。他是这样的一个算法。但如果是关税高了,还是要去建工厂的。
比亚迪呢现在是在匈牙利建的有工厂,它也是两条腿走路。你比如像巴西汽车关税6%,那咱就把车给你运去。你到欧洲说我们这欧盟关税高,那咱就在这建工厂,两边都在走。
那最划算的方式是什么呢?其实是特斯拉的Unbox的方式。特斯拉呢将整车拆成5-6个大的组件,用一体压铸机啪一下给你压成一整块。然后他从中国把这些大组件装到集装箱里头,运到比如说墨西哥的超级工厂去。这样运输的时候他就省地方了。他不像现在滚装船似的,你滚装船的话,你这个车是不能摞起来的,你每辆车还是要有一辆车的一个空间在那。你如果是组件的话,他一个集装箱里可以装四辆车的所有组件。所以这块的话运输成本要更低一些。
然后你把它运到墨西哥去,这个东西叫汽车零配件,墨西哥没收税。到了墨西哥装起来以后,再送到美国去,走美墨加汽车关贸协定又免税。这个肯定是最划算的。他等于同时躲过了关税,避免了在墨西哥建造完整的大型工厂。那一体压铸机,你在中国使用就可以了,也不需要再弄到墨西哥。
你再组装一堆的这个一组一体压铸机到墨西哥,就把这几个大块搁一块,啪一拼完事。你说他偷税漏税吗?我觉得还是有点嫌疑的。而且呢,这种方式还很节约运力,一条船可以装更多的组件,过去肯定要比运整车省地方也省钱。
现在呢,是整个全球的汽车供应链都在发生动荡。在这个状态下,咱们先卷一波运力。关税低咱就把整车运去,到明年肯定是运力过剩。比亚迪如果他的运力价格足够低的话,应该会卷掉其他几家日本的航运公司、挪威的航运公司。我估计比亚迪能够卷他们,咱就接着造船就完了。
当前的运力呢,是日本船最多,挪威第二,中国正在追赶。但是造船这件事,中国就是全世界老大。把全世界剩下所有国家造的船加一块,都没有中国造的多。中国造船业三大指标——完工量、新接订单量、手持订单量,已经连续14年全世界第一了。2024年,中国新接订单量占全球市场70%,手持订单量占58%,均创下历史新高。
以载重吨量来算(刚才咱们是按这个条数来算的),中国造船完工量占全球的53.8%,新接订单量占全球的69.7%。所以造船这件事,看中国就可以了。
各国政府呢,应该都会将汽车关税拉起来,只要你自己还惦记造车。比如日本你惦记自己造车,美国你惦记自己造车,欧洲你惦记自己造车,你就慢慢的建立汽车关税壁垒吧。像巴西、澳大利亚这些地方说:“我也不惦记自己造车了,我就惦记自己买个便宜车。”那你就把关税降低,咱就开着船给你送车去就完事了。
在这么庞大的滚装船队面前,中国汽车的生产能力以及库存量,这个才是真正吓人的。中国汽车产业在过去几年里积压了大量的车,咱就准备把这些车全都给你拉去的。而且咱们现在这种降价补贴的这种决心,还是相当恐怖的。所以咱们这条的标题是:全世界汽车产业有没有颤抖?
现在大家在等一件事,等什么呀?等特斯拉把Unbox的这个方式给它玩明白。你像特斯拉前面把这个一体压铸机玩明白了,那中国就赶快跟上,咱们现在都是一体压铸。等他把这Unbox的模式玩明白了,一群人等着他后边抄作业呢。这个后面肯定还会有很多的这种一体压铸厂在中国建立起来,然后到欧洲、到墨西哥这些地方去建这个Unbox的这种组装厂,我们去把这个关税躲过去。只要特斯拉能躲过去,咱也能躲过去。这就是未来的一个汽车产业链。
好,这个故事跟大家讲到这里。感谢大家收听,请帮忙点赞、点小铃铛,参加DISCORD讨论群,也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见!
2025-05-06 08:36:44
柴怼怼撕了于东来的逆鳞。于东来这一次说:“我不干了,我要把胖东来整个关掉。”
大家好,欢迎收听老范讲故事的YouTube频道。故事是怎么开始呢?2025年4月,有一个抖音账号突然开始炮轰胖东来了,说胖东来你卖的玉都是很便宜的玉,成本几百块的玉石,售价数千甚至是数万元,利润率高达几十倍上百倍。拿青海料、俄料来替代新疆料来卖,你胖东来就是花钱雇水军造神,造完神以后就去卖这些玉,完全靠卖玉把这钱挣回来,说太没良心了。
而且呢,还讲说胖东来15年前的火灾事故,八条人命换来的商业帝国,说血还没干呢,你就在这造神了。然后还在讲,说胖东来你一定是在偷税漏税,我们虽然没有证据,但是你肯定偷税漏税了。
胖东来肯定就不乐意了。因为玉这个东西确实是水比较深,这里头主要指的是和田玉本身的产业链呢,就稍微有一些灰色。你说到底有没有真的和田玉很高价值的?这个事呢肯定也有,只是呢,普通人或者绝大部分普通人很难分得清楚。
到底啥是和田玉呢?它有两种定义,一种狭义的,一种广义的。就跟咱们说什么叫三文鱼似的,狭义的三文鱼应该是产自北欧的这种鲑鱼,但是广义的三文鱼就是鲑鳟类的鱼,甭管海水的淡水的,是不是回流的,还是说压根没去过海里的,咱们就都算是三文鱼了。
和田玉呢也是这样。新疆和田地区产出的,以透闪石为主要成分的软玉,尤其是河床中形成的籽料,就是经过长期冲刷形成的卵型的玉料,因质地细腻、油润度高,被视为顶级玉料。这就是和田玉的一个比较狭义的定义。
那广义的是什么样的呢?根据国家标准,闪透石含量大于等于95%的软玉,均称为和田玉,不限制产地,包括新疆、青海、俄罗斯、韩国、加拿大等地产的玉料。其矿产成分与新疆和田玉一致,但产地不同,品质会有一定差异。
而且这种广义上的和田玉呢,产量异常丰富。整个的和田玉呢,价格体系也相对比较混乱,灰色的市场普遍存在以次充好、染色处理等问题,普通消费者很难辨别。而且呢,它的定价机制也极其复杂。和田玉的价格受产地、品质、工艺这些影响。
这个抖音账号说,胖东来就是拿俄料(也是俄罗斯产的)或者青海料(是青海产的)去冒充新疆料。新疆料贵嘛,它的品质也就是细润度、油脂感、工艺这些都是有影响的。行业平均的毛利率的话,大概是30%到50%。这个东西呢也很容易进行灰色运作。
部分商家通过直播诱导别人去低价捡漏,去诱导消费,退货率高达35%,而且维权非常非常麻烦。现在呢有很多种方式可以去加工这些玉石。
真正的和田玉不能说彻底绝迹了,就可能还很个别的时候,会出那么一个两个。为什么呢?你想这东西采了2,000多年了,到90年代以后呢,进行大规模的机械化采掘,所以基本上现在你已经找不到真的和田玉了。就是真的在和田地区,在河床里冲刷出来的,那你搞不定找不到怎么办呢?他们就玩这个叫滚筒染色,像洗滚筒洗衣机似的一个东西,把其他地方的这种玉料放进去,再加上石头,加上水在里头转。刚才不是讲了什么叫籽料?在河床里头长时间冲刷以后形成的这种椭圆形的玉料就叫籽料了。那我现在就给你模仿一个这样的环境,不就完事了吗?他们就在这样的滚筒洗衣机里头,比如滚个俩礼拜、仨礼拜,那出来了以后呢,就是珠圆玉润的籽料了。
他们除了滚筒染色之外呢,还会进行高温烧结,以及拿各种其他的料来进行冒充。因为它只要主要的成分对它就没毛病。但是有些人呢想要投资,想要捡漏,这个呢确实是容易被骗。和田玉呢具有极高的观赏价值和收藏价值,但是价值高呢,作假的手段就会不断的推陈出新。但是这些和田玉你说我今儿买了,过两天我想让它升值了以后再去卖,因为它的价格体系非常复杂。你要去卖的时候呢,收玉的人肯定就没有一个统一的标准来去收这块玉了。你说有没有靠和田玉发财的?也有,那你真的有可能家里传下来的一些玉,但是不是很多。
讲远了,那么胖东来怎么回应这个事?4月8号、4月10号,胖东来两度声明反驳,公布和田玉销售额2,190万元,真的是卖了不少和田玉,占集团总销售额的0.34%。那是一个很大的商超集团,他虽然卖了2,000多万的和田玉,但是占整体的很少。这个是在批驳什么呢?批驳胖东来造神,造完神以后靠卖和田玉把这个钱挣回来。整个的销售额在里边就占个0.34%,我挣不回这笔钱来,我还是老老实实在卖东西的,各种日用、食物,主要是卖这些玩意的。
而且呢我这个玉呢是有进货发票的,进了多少钱,出了多少钱,毛利率20%。我也没有像你说的似的,几百块钱进来卖几万,没有这么高毛利率,就20%。他要比日常卖玉的毛利率还要低。为什么别人卖玉毛利率高?退货率高嘛,经常买出去退,或者说我需要压大量的货在手里边,这个资金占压它也是成本。像胖东来就属于退货率很低,他的退货率大概连0.1%都没有。另外呢,就是周转的很快,所以不需要那么高的毛利率,人家20%就做了。而且胖东来规定什么呢?10万块钱以上的这个玉15%的毛利率。
10万块钱以下的是20%的毛利率。而且承诺什么呢?第三方检测,你拿去测去。测完了以后,只要不一样的,拿回来,我给你退。这个是他可以承诺的。那别的地方你要说,我买了玉了以后我去测了,测完了以后,你想退费老鼻子劲了。所以胖东来现在等于是把卖玉这件事呢,做成了一个流水的生意。胖东来的玉石柜台,这两天还有人去拍了,基本上是到中午下午就大面积售罄。说我们今儿就摆了这么多东西出来,到下午没了,是这样的一个情况。
4月25号,胖东来向许昌市中院直接起诉。正常的不应该直接向中院起诉,直接到中级人民法院,是因为他的标的比较高,说我要求索赔不低于500万。中院直接就接了。5月3号,抖音下架了柴怼怼29条侵权视频,限制其账号投稿权限一个月。就直接把怼胖东来的这个账号,叫柴怼怼,柴火的柴,怼人的怼,把他的账号直接给封了。29条视频下架,而且一个月之内不许重新上传。仿冒账号也进行了封禁。你说我再注册新的呗,因为柴怼怼账号一封了以后,马上就开小号叫怼怼柴,接着上来去说这个事去。然后所有的中号小号,中号就是还有点粉丝量的小号,就是完全开的新号,一律全封掉。这个是抖音做出的这个回应。
那柴怼怼这人到底是谁呢?他呢是温州柴氏珠宝的创始人,他自己有一公司叫柴氏珠宝,也是卖玉石的。自称呢从业经验仅有一年,且没有珠宝鉴定证书。就是他是没有珠宝鉴定能力的一个人。2010年呢,因为故意伤害罪入狱,判决书截图曾在网上流传过。但这种事呢到底是不是真的不好说,因为现在有AI,所以我不能保证这件事是确认的。直播中呢曾经宣称最讨厌河南人,引发过地域歧视的争议。胖东来,于东来都是河南的。
柴怼怼近90天直播销售额也就是50-70万,被质疑是借着打假呢引流变现。靠着骂胖东来,直接养了一个28万粉丝的一个号出来。做玉石生意,你不需要那种几千万的号,有一个几十万的号,就可以卖的挺好的了。而且还被扒出曾经销售过三无却湿茶,就是可以让人去掉湿气的这样的一种茶叶。他的玉石货源也存疑,客服就是他们家的家属。商标标注着介意染色勿拍,就是如果你觉得这个玉石染色了,你就别来买我们家东西就完事了。所以他的玉到底是什么样的东西,也不好说。
那么柴怼怼都在干嘛呢?柴怼怼做的事情其实很简单,就是骂人博流量。我在很早的一期视频里就讲过,现在是社交媒体时代,骂人就可以挣钱。人呢是有被迫害妄想症的。什么意思?就是你说这东西好。
你一定是5毛,你一定拿人钱了。你说这东西不好,哎呀,青天大老爷,真的是一双法眼。所以呢,在很多的社交媒体,或者说这种电商媒体上,大家都是这么干活的。
像我们以前也遇到过很多做类似这种事情的人。他们要想去起号怎么办呢?先去查淘宝数据,谁家卖的好我就骂谁。你谁家卖的好,你夸人家没用。你夸人家,人家不给你钱,还一帮人不信,说你这人肯定是拿人钱了。你看谁卖的好就骂他。
比如说我们遇到过一些卖母婴用品的。谁家的奶粉卖的好,我就来给你讲,这里头水可深了。说这个奶粉是进口的,假的,他没有这个报关单,他这报关单是改过的。他们就会不停讲这些事。讲完了以后呢,就有一帮人上来关注他,觉得你是火眼金睛,你真的懂行业内幕。然后讲完了这些以后,说来我来卖个奶粉吧,我替大家挑一个,你就买我的就可以了。他们是这么来挣这个钱的。
这种人呢,通常是特别敢说,也特别能说。刚才我也讲了,你一定要找这个大牌子去对标去。你说我找了一个谁都没听说过的牌子,去找人对标去了,那你对标了谁愿意看?所以像柴怼怼他逮上了谁呢?逮上了胖东来了。胖东来是一个自带流量的品牌,怼他这事没毛病。我只管骂胖东来,大家就来看我来了。谁红我就怼谁哈,他是这样的一个逻辑。
当然你说你干这个活,你嘴皮子不利索肯定是不行。像我这嘴皮子,我就没法出去怼人去,只能咱们自己在这讲故事。而且这个事呢,他的试错成本很低。什么意思?就是说我今儿怼错人了,换个号重新开怼,没毛病。或者我今怼完人以后,我东西我自己也卖翻车了,没事,换个品类再来。所以干这个事呢,基本上是没有什么成本的。
你就算是真的被判了,说我要罚500万。你说哎,我最后没钱了,公司是别人的,我公司还欠别人账呢,我就拿不出这钱来,也拿他没有任何办法。过一段时间就可以从头再来,或者树立新的马甲。不一定是他自己来,他可能换一个人再来。这柴怼怼后边,是不是有其他的这种机构不好说。因为在江浙一带呢,卖这种玉石的人还是蛮多的。只要有人愿意信他,就可以把东西卖出去。
那于东来为什么这次要关闭胖东来呢?他也遇到过很多事,不是说头一回有人投诉,头一回有人说他卖东西是有问题的。怎么到这一次就这么生气呢?到底哪一片逆鳞被触了呢?原来胖东来被人举报,你的月饼有问题,你其他什么东西有问题,该赔赔呗。甚至还有时候,给这个举报的人发奖金。我们确实没发现,你发现了,我们给你发奖金。如果确实你冤枉了我,你还不依不饶的,那我就起诉你。
这个是东来一直以来的一个风气,就真的是叫不搞事,也不怕事。而且每一次呢,都会出一个特别长的报告,说我们这到底是怎么怎么回事,怎么进的货,怎么去跟踪的,怎么去这个确认的。每一次都有几十页的报告,这个算是一个行业标杆了。那这次怎么就爆发了呢?
于东来说:“这种人不受到处罚,就把胖东来关了,或者是离开胖东来这家企业。我不干了,你们谁愿意干谁干,我不玩了。”他讲了这样的一个话出来。对于于东来这种人来说呢,把他挤兑到这个份上也确实不容易。
这个就要讲到刚才我们说柴怼怼怼了这么多胖东来的点,其中有一个点,叫胖东来15年前火灾事故:“八条人命换来的商业帝国。”实际上就是讲的这件事。我呢去查了一下,不是15年前,而是27年前。当然做抖音嘛,时间稍微的有一些偏差是可以理解的。
这件事呢是发生在1998年3月15号。这个时候有一起火灾,许昌当地的黑恶势力头目韩和平等人,多次到胖东来门店寻衅滋事,调戏女员工并殴打劝阻的店员。3月14号晚上,于东来率领员工反击并驱离了歹徒。次日凌晨,韩和平伙同张东营等人,携带汽油纵火报复。大火迅速吞噬望月楼、胖子店,以及楼上的宾馆,造成8人死亡,最小的遇难者仅两个月大。讲的应该是这件事。
这场灾难导致胖东来直接经济损失超百万,于东来背负了巨额债务,甚至一度想要自杀。惨案发生后,许昌市民自发为于东来捐款百万,供应商主动减免了一些货款。胖东来的店也就算是浴火重生,没有这场火就没有后边的胖东来。于东来这个人呢,也基本上是被这场大火整个重新塑造了一遍。他的性格以及现在胖东来的很多规章制度和底层运营逻辑,都是来自于这一场大火。这个就是真的逆鳞了,绝对不能碰。
所以这一次于东来就强调了:“若善良被践踏,宁愿退出,我不玩了。”那为什么现在造谣中伤这么容易,维权这么费劲呢?如果严格筛选,只允许说真话的话,就基本上没有几个人能说话了。像我现在说的这些东西,我虽然都上网去查了,但我也没法保证它是真的。我只能说,我跟大家提个醒:“我是上网了,通过搜索引擎,通过AI去确认的信息,我不能保证它完全是真的。”
但是有些人他不这么说话,有些人就拍着胸脯说:“我就认为这事是这样。”这些人呢还很容易把东西卖掉,很容易聚集起粉丝来。所以在这样的情况下,你说:“哎,大家都必须说真话,谁说假话我们就怎么怎么样。”这个事不可能。这还不要纠结说怎么去判断真话的标准这件事。社交媒体平台本身呢,它也是个公司,它也在那运营。
它也有经营压力。对于他们来说,肯定希望看到更多的流量与互动。所以呢,通常这些社交媒体平台会希望有一些冲突性的话题。你一定要在里头吵架,你如果不吵架的话,都是你好我好大家好,大家都在这说真话,那这个社交媒体还看他干嘛?大家去看新闻联播就完了。
而且人性本身呢,也存在一定的劣根性。第一个猎奇,第二个喜欢随声附和。而且呢,更愿意相信阴谋论,就是“总有刁民想害朕”,被迫害妄想症。这都是人性的劣根性,而且是看热闹不嫌事大。只要是有热闹,咱们都要搬个小板凳,举个瓜在旁边要看一看。
这种事情呢,追究起来的成本也是很高的。因为你想去确认这个是不是真话,是不是假话,到底给你造成多大损失,这个周期非常的漫长。你看今天胖东来去起诉这个事情,等宣判今年我估计都判不下来。等判完了以后,那边没准还上诉或者还怎么样,那这个事就很费劲。
而对于社交媒体平台来说呢也是如此。你今天说投诉了,谁谁谁造谣诽谤我了,中伤我了,让我不舒服了,那社交媒体平台就直接把对方号删了,不就完事了吗?不是这样的。你社交媒体平台如果直接去把对方的号删了,或者去进行了处罚,等过两天判下来了,发现不是这么回事,你赔还是不赔?所以平台也很烦。
比如在谷歌呀、在苹果呀,在这些平台上开发APP,大家相互之间有一些什么样的纠纷了,谁抄袭我了。对于谷歌来说他们怎么处理?他会直接让你们自己去聊,你们自己吵明白了,我们再去决定说到底是下架谁不下架谁。他是不会上来就下架一家的,你万一最后做错了你赔不赔?这事很麻烦。
而且这些平台还有一个执行标准是什么?就是你去起诉,你拿着这个诉状回来,我就给你们两边都去处理一下。最后判下来以后,我按照法院判的来去处理。所以他们虽然手里头握有一定的规则执行能力,但是呢他们有时候也不愿意承担相应的责任。
最后呢在国内处理类似这种案件呢,他的处罚是相对比较轻的。而且呢平台本身是旱涝保收,甭管谁对谁错,对于平台来说他没损失。而且有了这种事情以后,对于平台来说我这还有流量了。我这两天看抖音,一堆人在这分析这个事,说我去买了柴氏珠宝的玉石手串了,我测了一下发现这个料都不对。还有人说我去鉴定了,怎么怎么回事。还有人说我拿着胖东来的货去鉴定了,如何如何。一堆人在那蹭这个流量呢。
对于抖音来说,甭管最后谁输谁赢,他都赚着了。是这样的一个平台。就算是柴怼怼最后输了,他也绝不会掏出500万来,说我真赔这个事,总共他也没挣这笔钱出来。
他就完全是一个光脚的,不怕穿鞋的一个状态。所以现在呢,社交媒体时代,造谣确实是要更容易一些,维权更难。
总结一下:
第一个,非标投资品类建议大家稍微远离一些。今天咱们讲的这么热闹,和田玉这个事呢,您说我喜欢,我就是热爱玉文化,那您买一点在家里摆一摆没毛病。你说我火眼金睛能捡漏,经济不好的时候我还能把它卖出去,我还能挣着这笔钱,建议大家慎重吧,也只能这么讲。
第二个呢,社交媒体时代呢,类似这种事情确实很难杜绝。有了AI以后,类似这个事情可能会更多一些。希望呢,可以提高一些处罚的力度。如果有人真的损害了他人的利益,能够有更高力度的这种处罚。要提高试错成本,你不能像刚才我讲的似的,试错成本很低。我今怼了你,怼错了,下回我换一人怼,中间基本上没成本,这个事是有问题的。
最后呢,也希望胖东来可以继续好好的经营下去。有这样的一个传奇故事伴存在我们身边,也算是时代之幸吧。
好,这个故事今天就跟大家讲到这里。感谢大家收听,请帮忙点赞、点小铃铛,参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见。
2025-05-05 08:36:54
Meta召开LLAMA Con开发者大会。他原来丢的这些课程,现在补还来得及吗?
大家好,欢迎收听老范讲故事的YouTube频道。4月29号,Meta召开了首届的LLAMA CON开发者大会。Meta原来是开open大会,他反正每年都会开一到两次的这种开发者大会,这是开了第二次开发者大会了。这一次呢,主要就是对LLAMA进行了一些发布。前面LLAMA4已经发布过了,而且发完了以后还翻车了。现在呢,Meta说我也要去补课了。
补什么课呢?第一个是我要出一个独立的APP智能助手,叫MetaAI APP,对标ChatGPT。另外呢,我要开始面向开发者直接提供官方的LLAMA API服务了。这块呢,还准备去跟Groq这些芯片厂商去合作去,我帮他们去部署。现在呢,LLAMA的这些服务都是免费给大家使用的,LLAMA API未来有可能会收费。
你说人家OpenAI一出ChatGPT就开始给大家提供服务,APP也出了这么长时间了。这Meta真的是起了个大早赶了个晚集,到今天才想起来说我的这些API也要为大家服务了,我的APP也要为大家服务了,还来得及来不及?
首先跟大家说一下使用的情况。MetaAI APP呢,我去下载了一个。下载完了以后呢,一开始说对不起,在你这个区域不服务,这个也很正常嘛。后来我又使用了一些手段,终于让他跑起来了。跑起来以后第一件事说,请把你的眼镜拿出来。什么眼镜呢?就是Meta的这个智能眼镜,跟雷朋做的这智能眼镜。说我必须要连智能眼镜,我在那跟他折腾了十几二十分钟。我说能不能跳过去,我说咱能不连这东西吗?不能,你只要启动这个软件就必须连这个智能眼镜,连不上它就不往前走了。我只能把它卸载了。
至于说LLAMA API呢,因为原来我们也在云端使用各种LLAMA的模型,LLAMA2、LLAMA3都用过。但是呢,都是由第三方云厂商来提供的,从来没有官方提供的。而第三方厂商提供的这些LLAMA API的话,就都要收费嘛,而且比较贵。现在Meta说我现在要官方提供了,你直接在Meta云上就可以用了,不用再到各个的平台上去找去了。而且你到各个平台上找了,他这个版本也不一致,有大的,有小的,还有各种微调过的版本,服务的水平也不是很一致。这块,你们统一都到官方来。而且你到了官方以后呢,还可以把这种微调的版本存在官方的云上。反正我有这么多GPU,咱跑呗。
现在用的人也少,咱们就免费。像Grok他们家的这个XAI的API,现在其实也是免费的。我现在每个月还是用的蛮多的,但是作为个人吧,应该是没有达到使用的上限。所以你基本上做各种测试、开发都是不要钱的。这后来者必须要靠免费,这是生生的迟到了两年。但是呢,依然做的非常的不彻底。
你想LLAMA1是Meta公司2023年2月24号发布的,当时发布出来这些事就应该干。现在都2025年5月份了,才开始搞这些事情,才开始补这个坑,真的是起了个大早赶了晚集。为什么整成这样呢?就是他一直在纠结元宇宙,直到现在为止还是没有放弃。你现在想要在手机上,甭管安卓手机、苹果手机,你想要用MetaAI APP,对不起,您还得去买他们家的眼镜去。也不知道他到底卖了多少眼镜了,你没有眼镜不让用,这个很神奇。
那么各大厂商都是怎么做的呢?看看人家先进同学、好同学,别人家的孩子怎么干的。OpenAI跟Anthropic肯定是标杆,这两家怎么干,其他人照着抄。每次发布新的模型、新的版本,一定是有官方的API出来。而且这些官方API通常是在它发布之后,有的时候可能就是当天就用了,有的时候会过个几周。比如说前两天发布的GPT4O image,就是画图的这个功能,应该是发布了以后过了两周还是三周,这个API就出来了,大家就可以上去用。而且在很努力的去争夺流量入口,甭管是OpenAI的客户端,安卓、iOS、Windows、Mac,我不知道有没有Linux版本,反正就全都有,包括各种网页都可以用。Anthropic也是如此,安卓、Mac、iOS、Windows都是有的,都在很努力的去抢占各种客户端,抢占流量入口。
还要去做什么?Chrome插件,就是你的浏览器上还要做插件。大家有没有试过在Chrome浏览器上安装OpenAI的插件?装上了以后呢,Chrome就警告,你说它想改这个默认搜索引擎行吗?你一说同意,你再往后在Chrome的地址栏里输入什么东西一打回车,就直接上OpenAI搜索去了,没有任何其他的功能,也要把这个流量入口抢回来。人家都是这么干的。
国内的厂商呢,通常都是站这一队,照这样学,包括是阿里、字节呀、百度。字节学的是最快的,百度跟阿里呢,还是要稍微的慢一点点。国内呢,是分两个阵营,大厂的其实通常都是云计算厂商,包括字节后边都是有云计算服务的。新势力呢基本上就是。
照着OpenAI和Anthropic这条路走,就没毛病了。因为OpenAI跟Anthropic都不是云计算厂商,他们两家的服务器都是部署在其他人的云上的。OpenAI是部署在微软云上的,Anthropic是在亚马逊云上。这个跟国内的云厂商还不太一样,国内蔚小理这些人基本上是一模一样在照抄他们的作业,也是在抢占流量入口。
谷歌的Gemini呢,原来也是有点晕头转向的。虽然事儿干了,Gemini的客户端也出来了,API在官方也提供了,但是呢非常难用。每一次有新模型出来以后,都是在AI studio,就是给程序员用的API接口这块,在这先出来。可能很长很长时间以后,才会去Google Gemini客户端。所以它这个版本更新的都非常奇怪,很多人说新版本出来了,我怎么用不上?你们一帮人在这说好,一帮程序员你们在这自嗨。我说对了,谷歌就是程序员的公司,它就是专门为程序员自嗨设计的。
但是现在好很多了,最新的版本Gemini 2.5 Pro已经在Gemini的客户端上直接可以使用了,而且可以免费使用。这就完完全全在抄OpenAI的作业,现在Google算是醒过味来了,而且这个作业呢基本上算抄对了。Gemini 2.5 Pro是我现在用过的各种模型里效果是非常非常好的一个,特别是对程序员很友好。所以我现在大量的工作都是使用Google Gemini来工作。
马斯克的XAI呢,它的路径比较飘忽。因为公司非常小,它的融资规模很大,但是人很少。他的路径呢经常是看谁家好,就赶快往里边飘一点,那边好就往这边飘一点。要开源,我也开源去了;要提供API,我也去提供API;需要APP吗,我也来了。现在Grok APP是单独的,是在x之外专门有一个APP叫Grok。你说我需要做什么deep research,需要做什么AI agent,这那我也上。一帮人更新了以后,我这个Xai的GROK3好像不是最新了,不是最好用的这个了。更新更新,5月5号这周,马斯克承诺要更新Grok 3.5出来。他就还比较飘忽。
腾讯呢,算是逼不得已自成一派。为什么?他前头走的比较慢,自己做的各种模型压根就没怎么做出来。等到DeepSeek上来以后说算了,我全线拥抱DeepSeek吧,就开始直接抢流量去了。就是底层模型它就不更新了,或者更新了,大家也不太惦记了。所以现在腾讯在用元宝跟大家抢流量。
Meta呢,到目前为止,其实依然没太想明白后边到底要怎么玩。虽然它开发了独立APP,虽然他现在开始提供官方API了,但是未来怎么办,他其实还没想明白,更不要说怎么能够赶上了。那你说Meta到底是,怎么整成这样的一个样子呢?起了个大早,赶了个晚集。
第一个大原因是战略上的惯性。扎克伯格呢,一直惦记搞元宇宙。这个原因也很简单,并不是说扎克伯格看到了元宇宙未来发展的方向,他只是被苹果恶心到了。作为一个这么大公司的老板,这么大的平台,全世界有这么多用户,被苹果狠狠地恶心了一把。因为他的软件必须要在苹果和安卓的设备上才可以去挣钱,才可以去放广告。苹果说我要管你,你的这个权限不能有,那个权限不能有,这个数据不能用,那个数据不能用,差点没被苹果弄死。然后扎克伯格说,我一定要革苹果的命。原来Facebook是个APP嘛,你要上人家的APP store才可以去工作,你上了人家的APP store,人家就要立规矩,你要去遵守。现在说APP是最差的,我坚决不要这东西。但其实呢,他所谓的元宇宙是他自己要坐苹果那个位置。在这个位置上,我要让其他的人都在我这下面做APP。他就惦记说我要去整平台,这就是他整元宇宙这个事的最初始目的。
后来发现搞不定,因为VR、AR都卖的不是很好。搞不定,那怎么办呢?转向这个大语言模型,因为别人都在做这件事,他不转这个向他搞不定。但是呢,内部的各种层级条块之间都不太愿意去放弃元宇宙这个事情。原因很简单,扎克伯格自己没放弃。现在他去开各种的什么财报会、年会、季会什么,还在那讲的,说我元宇宙这事没放弃,我还接着干呢。VR头像其实也还在做。但是呢,现在主要想去做跟雷朋设计的这个眼镜,我也没买过。甚至还出来说,我现在要进入时尚界,这个眼镜是最时尚的事情,在开始搞这样的一个,就是没有梗硬吃的这么一个事情。
现在在这样的一个平台下呢,特别是老大没有放弃的情况下,那只能大家说,什么事都得带上点。你如果不戴上的话,好像就是忠诚的不绝对,就是绝对的不忠诚。我记得原来有首诗词:“宰相巍巍坐庙堂,说着精量便要精量。那个幕僚上一章,头说精良尾说精良。轻狂太守在五洲,闻说精良星夜精良。山东河北久抛荒,好去精良胡不精良。”这个是南宋时期一个词人写的词。什么意思?就是这个宰相在庙堂上坐着,说我要把这个土地丈量一下。他说完了以后呢,拍脑袋说一出是一出。下边这些幕僚官署呢。
一看到这事,这赶快得说呀!我也得上一个章附和一下。从头说丈量,尾巴上也说丈量。有一个很轻狂的太守,听说要丈量土地了,星夜丈量,就是晚上就开始干,不要等明天了。说这个河南、山东、河北这么多地方都被金人侵占了,现在金人走了,这一块都抛荒了,你这怎么不去丈量?讲了这么一首词,其实就很像是Meta现在的一个状态。
做了个APP,还惦记把那个眼镜挂上,不挂眼镜不让你用。这个呢,算是在特定语境下的黑暗森林。黑暗森林法则是什么?就是猜疑链嘛!不知道你是不是好人,我也不知道怎么告诉你我是好人,我也不知道我告诉你是我是好人之后,你会怎么对待我。这个产业链无限延长以后,就没有办法沟通交流了。其实很多大公司都是这样的,现在对于Meta来说就是这样。我不知道你是不是元宇宙这一派的,我也不能告诉你我不是元宇宙这一派的,我是大模型这派的。我不能跟你说,我也不知道我告诉你了,我不是元宇宙这派的,你会怎么反馈。他会有这样的事情。
但我只知道呢,在这个公司里从上到下,你是不能批评元宇宙这个事的。你不能说元宇宙不好,这个事也不容置疑。这个事是变成这样。其实在任何一个语境里头,当某件事情不容置喙的时候,就会形成一个黑洞,就会变成一片黑暗森林。这个是Meta掉队的一个很重要的原因,因为他战略方向一直没有确定下来,还惦记玩元宇宙呢。
另外一个原因是什么呢?就是他的科学领头人太科学、太超前了。他科学领头人是谁?叫杨乐坤,是个法国人,后来跑到美国去。他呢是Meta的副总裁兼首席人工智能科学家,基本上就是他领头的。这光环满满,深度学习三巨头,这个项目是2018年获得图灵奖,所以也叫图灵奖三巨头。因为获图灵奖人多去了,但深度学习这块三个老大。然后呢,还有一个title叫卷积神经网络之父。这样的一个人在这带头,这么有钱的公司,这么多用户,老板也说我要去做大模型了,还有这样的科学带头人在这顶着,那咋就不行呢?
这个老哥每天出去演讲,都在讲什么?大语言模型不行了,靠预测TOKEN这种方式是搞不定的,这条路走不通。作为大学教授、科学家,你愿意讲什么讲什么没问题。他呢只是太超前了。未来一段时间,肯定还是会有新的方法、新的算法来去替代Transformer,来去替代这种TOKEN预测这个方式。你现在作为一个公司的副总裁和首席科学家,你讲这个话真的不合适。你讲这个,你让下边人怎么干活?怎么向你汇报工作?上杨乐坤这汇报工作来了。
我们把LLAMA4再怎么推进了一下,然后他给你讲了半天说这事不行,这条路走不通的。你说你咋办?所以Meta是一个什么样的现状?CEO还惦记搞元宇宙呢,首席科学家总在那说方向错了。那你让下边人怎么干活?好难。
他发了这四个版本的LLAMA,真的是为中国奠定了大模型的基础。没有他们,就绝对没有中国今天的大语言模型。什么人工智能、AIGC,整个都没有,都是从这开始的。所以还是要感谢他们。
但是呢,在自己的产品跟服务之中,只进行了非常有限的改进和融合,并没有完完全全把这些LLAMA用起来。新的流量完全放弃,因为他自己有的是流量。OpenAI、Anthropic、谷歌现在在抢占的这个流量,原来就压根没动过,到今天才开始想起来:“我也得得着这流量,不能让你们都拿走了。”
弄完了以后还眼镜捆绑上去,没有眼镜我不让你玩。我很高傲,玩了这么一套东西。新的技术社区完全任其自生自灭:“我把LLAMA做出来了,做完了以后呢,你不能在我的社区讨论,你也不要到我这儿来。去使用官方API?没有的,你们谁愿意用谁用。反正我头一个我把东西拿出来了,大家都跟着使,就这样就完事了。”
新的技术方向已经基本上失去领导地位了。开源大模型这一块,基本上是被阿里的Qwen站在前面,真正领旗的位置上了。那你说现在还来得及吗?咱们最后来回答这个问题。
结论:再照抄别人的作业,肯定是来不及了。因为人家已经提前跑了两年了,你现在大模型也不比别人先进,甚至还是测评翻车的一个状态。现在想把人家的这个官方API和独立APP这个作业抄上,就想去追赶,这是不可能的。
现在就还需要补更多的课。第一个是什么?就要把AI agent加上,现在他这一块呢还是短板,别人都已经走到这一步了,还得把这个课补上。第二个呢,别再捆绑眼镜了行不行?你想,Meta那么多用户,有多少用眼镜了?你现在是要把所有的Meta用户转换过来来做Meta AI,而不是说眼镜那几个用户。甚至这个眼镜用户,可能还要把这个吃灰的眼镜再拿出来,再去转换Meta AI。所以不要再去捆绑眼镜了。
如果不捆绑的话,过两天我再去试一试。如果真走通了要干嘛?像腾讯现在推元宝这样撒狠钱进去推。但是Meta好像在这块一直都比较佛系,因为流量对于他来说比较富裕嘛。他老觉得这些流量就在这待着,我只要是给了功能,大家就会去使。真砸钱去推这一块的话,Meta好像并不是特别激进。腾讯现在就是砸死了钱往里推。
一个月花多少亿人民币往里砸,现在在干这样的一个事情。Meta真正该干的活是什么呢?就是要放大自己的优势:场景、社交。要跟腾讯学,还有各种变现。Meta的变现就是在Meta上打广告,然后做各种的社交、内部的信息传播。这块是非常强大,有一堆人在围绕这一块去思考,再去写程序,再去创业。
Meta的LLAMA一定要在这一块要往前再走一步。如果这块不走的话,他一点优势都没有。这就是今天咱们讲的故事。Meta现在补作业还来得及来不及?
这个故事今天就讲到这里。感谢大家收听,请帮忙点赞,点小铃铛,参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见!
2025-05-04 08:47:42
Qwen3发布了。这到底是划时代的胜利,还是翻车了呢?
大家好,欢迎收听老范讲故事的YouTube频道。Qwen3真的是千呼万唤始出来。前面好几周就已经不断有传言说Qwen3要发布,要多么多么强大。突然发布之后,当然也肯定是伴随着一大堆的评测数据了。官方评测数据呢,永远是我超越了谁、超越了谁。但是很多评测的人呢,觉得好像差那么一点点意思,没有达到预期。所以今天我们来讨论一下,这到底是又一次划时代的胜利,还是翻车。
Qwen3呢是凌晨发布的,4月29日凌晨上线,在Github上全面开放。我呢已经开始用上了。使用的方法有几种:
第一种是本地部署。我是MacBook Pro,M2 Max的芯片,32G内存。其他的不重要,你到底有多少硬盘,这个事没有那么重要。本地使用OlAmA部署,我使用了8B、32B和30B-A3B。最后这个是什么意思?最后是一个MOE的模型,它是30B-A3B,就是说它每一次干活的时候激活3B,也就是30亿参数。它是这样的一个标注。就这三个版本的模型,在我本机都可以跑,速度呢都是还可以接受。
云端,第一个你肯定上阿里他们自己家玩去。阿里云百炼平台,使用支付宝或者淘宝账号刷一下,就可以进去使用了。价格还是很便宜的,特别是一些很大的模型,还是要在这个上面才能去跑起来。然后open Router永远是最快的。4月29号凌晨发布的,4月29号白天就可以在这个平台上用上了。硅基流动稍微晚一点,大概到5月1号可以去使用了。
那么Qwen3有什么样的特性呢?第一个是全配置,这个非常非常重要。什么叫全配置?就是它从很小的模型到很大的模型,所有的配置都是完整的。首先它提供了稠密模型,不是MOE,就是单个的这种稠密模型,从0.6B、1.7B、4B、8B、14B、32B,这些都提供了。MOE模型提供了30B-A3B和235B-A22B。235B-A22B这种模型什么意思?就是说一共是2,350亿参数,每一次激活220亿个参数。它是这样的两个MOE模型。
全场景。你在移动端0.6B到4B这样的模型,在移动端没有任何问题都可以跑。说我在终端推理,或者是在PC端跑一跑,做一些商业应用,8B、14B、32B都是可以跑的。你说我有一些复杂任务,或者做一些AI agent开发,30B或者是235B的两个MOE模型非常好用。而且呢是全语种,它支持119种语言。不过这块有人在吐槽。
这119种语言,好像除了中文、英文和常见的几种语言之外,其他什么斯瓦西里语这种奇奇怪怪的语言,支持的并没有那么好。
训练的过程呢,稍微的跟大家展开讲一讲。预训练用了36T的数据。LLAMA4的预训练数据的话是30T,Qwen3的话,比LLAMA4的训练数据集还要再大一些。
它的第一阶段呢,是使用了30T的数据,训练了一个基础语言模型出来。第二阶段用5T的数据呢,去强化STEM,也就是这种科学相关的能力,以及编程相关的能力。到第三阶段呢,就是扩大上下文。一开始这个上下文是比较小的,经过第三阶段的扩大以后:
– 4B以下的模型,也就是刚才我们说的0.6B、1.7B、4B这三个模型,它们的上下文呢达到了32K。
– 大于4B的模型,也就是8B、14B、32B,以及MOE的两个模型30B和235B这几个模型,他们的上下文呢都已经达到了128K。
– 在一些特殊情况下,可以达到256K的上下文。
这块呢,有待继续提升吧,因为LLAMA4的上下文是10兆,要比它大很多。
数据来源,就是拿什么数据来训练的这个东西:
– 60%的数据呢,是互联网原生数据。
– 25%呢,是专业领域的数据,包括GitHub上面的代码、数学公式、科学数据。
– 还有15%呢,是合成增强数据,就是拿其他的大模型去生成的一些数据,用的是Qwen2.5的一些模型生成了一些数据。这块呢,主要是做一些推理链的训练,而且也可以做多语言的对齐。
这就是它的数据来源。这块呢,跟LLAMA4就有很大的区别。LLAMA4大量的使用的都是合成数据,而这个Qwen3的话,使用的大量是原生数据。
在预训练之后,还会进行后训练。后训练的话,实际上是对模型做微调了。他呢,在分四步对Qwen3进行微调:
1. 第一步是长思维链冷启动的训练,注入数学、代码等领域的常推理数据。
2. 第二步呢,是强化学习探索强化学习,就是你给我生成结果,我们来打分,然后你根据我的打分来决定说这个结果对不对。它是基于规则奖励,提升复杂推理能力的一个训练。
3. 第三步呢,是模式融合。这个东西特别好玩,它是一个融合模式的推理模型。什么意思呢?因为我们使用推理模型的时候,有一个特别讨厌的东西,就是有些特别简单的东西呢,给你推理半天,甚至推理的TOKEN还消耗了很多。对于Qwen3来说呢,它里头有一个参数,就是你是不是要打开推理。同一个模型呢,你可以在这设说你不要打开推理,他就快速的给你出一结果。你说你给我做推理。
就给你啰里八嗦的去想去了,这个也算是个创新吧。原来都是推理模型,就是必须要推理。他是做了这样的一个训练,然后第四步呢是进行通用校准,特别是覆盖20多个领域的强化学习,修正一些不良行为。他等于做了预训练之后,还做了大量的微调后训练。
那么,Qwen3的技术创新到底有哪些呢?
第一个就是它这个混合推理架构。就是你到底想不想让它推理,你告诉他就完了。他给你去推去,或者是直接给你一个答案。
第二个技术创新呢,就是它的MOE的参数效率极大提升了。它的235B的模型里头,每一次激活只激活22B的参数。它要比DeepSeek R1激活的参数要少很多,只有DeepSeek R1 1/3的参数。它整个的模型尺寸也只有DeepSeek R1的1/3。所以呢它的部署成本要比DPC卡R1要低很多,推理的效率也要高非常多。
第三个呢就是多语言和多模态的支持。第一次支持了119种语言,2025年内将推出Qwen3-Vl多模态版本。现在的Qwen3还不支持多模态,你给他张图片他还是认不出来的。这块还是比LLAMA4要差一点。LLAMA4是你给他个视频,他都可以给你进行推理。
最后,Agent能力增强。它呢是直接支持MCP,原生支持MCP协议,工具调用准确率提升40%,API代码量减少70%。这个是Qwen3在这一个时代里头,必须要去实现的功能。这也是它比LLAMA4强的地方。
对Qwen3的期待、评分以及使用感受方面,还是有一些落差的。各项评分一定是高的吓人。因为你现在说,我今天推出一个新模型出来,你一定会自己做一大堆评测,然后跟模型一起推出。如果你说我自己做的评测就比谁都差,那这事你还推它干嘛?一定是说我现在评测了,比大家都强了,我才可以推出来。所以评分一定都比大家强。这块呢,就不跟大家详细去列举说那个评分是多少了,没有什么意义。
但是呢,这个里头比较好玩的是什么?就是它是一个田忌赛马的故事。大家知道什么叫田忌赛马吗?用我们的比较差的马,跟人家那个最好的马比,我输掉了。然后呢我用我的最好的马去跟人家的中马比,我赢了。用我的中马去跟他的最差的马去比,我又赢了。等于三局两胜,我赢两盘。他是很多做这样的这种比较。
为什么Qwen3有田忌赛马的这个能力呢?你比如说,8B的模型可以达到人家的32B的效果。我现在是32B的模型,我可以达到原来72B的效果。他等于做了很多这种错位的比较,我用更小的模型。
达到了以前必须用更大规模模型才可以达到的效果。当然,田忌赛马呢,也未必都是好事。为什么?因为很多人会对这种小参数模型抱有不切实际的期望。一堆人拿来说:“我拿这个8B的模型跑一跑试试,看看我去做一些很复杂的任务,到底效果怎么样?”肯定效果不好。千万不要认为你用8B的模型就可以跑出非常非常好的效果来,这个肯定还是有一些差距的。它可能会在某些特定的领域,或者经过一些微调和训练之后,可以达到32B的效果。
绝大部分人对大模型的认知都是停留在什么GPT-4O这个水平的。你要想拿8B的模型去跟这样的模型去比的话,没有任何可比性。那你说我使用这些32B的模型呢?就属于在大部分情况下可以接近GPT-4O这样的一个水平。咱不研究多模态那些东西,就是正常的内容生成,算是接近。至于说它的235B呢,现在距离Gemini 2.5 Pro还是有一些差距的。但是呢,相对于其他的模型来说,基本上算是跑在同一个基准线上了,不比别人差了。
Qwen3 235B-A22B的这个最大模型在数学、代码、Agent等方面都是全面超越了DeepSeek R1。部分场景呢,接近Gemini 2.5 Pro。这什么意思?就是全部的场景肯定离Gemini 2.5 Pro还是有一定的差距的,但是有一部分场景接近了。但在复杂语义理解,就特别复杂的情况下,还是有一些差距的。特别是一些复杂的逻辑分析,它是有问题的。真实使用的感受呢,算是能用。比起DeepSeek R1强吗?其实感觉不太出来,基本上可以达到DeepSeek R1的水平。
指令依存方面呢,肯定还有一点点欠缺。让他做一个很复杂的动作,他有的时候还是会丢三落四一些。这块我自己试过的,网上也有很多吐槽的人。第一个,复杂推理中的逻辑断层和幻觉生成的问题。所有推理模型身上都有这样的问题,Qwen3即使是最大的模型235B,在这块呢,也不比别人好多少。第二个呢,就是过度思考跟效率问题。有些人发现说:“我给他一个很复杂的问题,他自己开始进行推理了,推理来推理去,直接死在里头了,彻底推不出来了。”这种情况现在也还是存在的。
但是呢,也不用太着急。他既然可以进行后训练,可以进行微调,那我相信大家有各种问题去提就完了。Qwen应该会快速的微调出不同的版本出来的。多语言支持的不均衡,你说119种语言,那些小语种支持的肯定没有那么好,因为语料也没那么多嘛。但这一块你想让它提高支持的话。
也很简单,拿足够多的语料去微调就完了。他也是可以去支持的。然后还有一些伦理跟隐私方面的风险,因为它可以有非常非常小的模型。所以你可以把这种模型,比如部署在你们家洗衣机里,或者部署到一些很奇奇怪怪的这种角落里面。他的能力还很强。而且这种全开源的模型,还有一些人微调了以后,是可以把他的一些安全限制去掉的。这个就会比较吓人,所以大家对这块呢也有一些担心。
还有呢,就是模型对齐和偏好上面的一些问题。比如说吧,生成内容有时候会偏离用户的意图。它对一些指令的依从,还是会稍微差一些的。那么给出一个简单的结论吧,这到底是一次划时代的成功呢,还是翻车呢?我个人的感受呢,这又是一次划时代的胜利。
Qwen3真正在跟谁竞争?大家要想清楚:LLAMA 4、DeepSeek R1、Claude 3.7、Gemini 2.5、GROK3、GPT O3 O4这样的模型,到底在跟谁竞争?实际上真正去跟Qwen3竞争的只有一个,就是LLAMA4。其他的都不在同一个起跑线上。
LLAMA4呢,是翻车了。它怎么翻车的?第一个是数据造假,或者叫过拟合。拿直接去跑分的题目进行训练,这样跑分效果特别好,但是实际使用的效果差异巨大。这是LLAMA4翻车的一个最根源的原因。
咱们从另外一个角度上来讲,LLAMA4自己其实是有一些问题的。第一个是什么?就是它公开的模型太大,占资源很多,放弃了绝大多数的场景。他就开源了一个104B,一个400B的模型。普通人你拿他没办法,像我的电脑根本跑不起来。你就算部署到云端的话,它占资源也是占的非常多的。就对于这个经济性来说,一点优化都没做。你说我想在手机上跑,想在嵌入式设备上跑,没做这个准备,他就不惦记。甚至还有一个两T的模型,压根都没有发布出来。他就发布了一个109B,一个400B,其他都没有了。
而且这么大的模型,你想去微调那太痛苦了。就是你想微调一个模型,模型越小越好调。你模型越大的话,你调起来甭管是你的数据还是算力,都是非常巨大的成本。现在看的LLAMA,应该是准备走XAI这条路。
XAI是什么路?假开源。为什么马斯克的XAI叫假开源呢?就是我确实把东西开出来了。他承诺的是什么呢?就是我发布新版本,我就把旧版本开源。而且呢,开出来的东西,你要想调用的话,你也调不了。为什么?我只把那最大的模型出来,哐昌往那一扔就完了。各种的文档,各种东西都很少,你部署上去也不划算。
所以呢,我开源了吗?开了,东西也放这了。能用吗?没法使。你提任何问题、提任何要求,说哪给我改一东西,也没人理你。这就是XAi的玩法。
你要想调用这些东西怎么办?到我服务器上来调用XAI的API,这个是没问题的。我现在也在Grok的服务器上去调用它的API,效果也还可以。但是你说有没有第三方去部署Grok模型,然后让大家去调用呢?没有。因为你现在开源出来的版本低,它的效果没有那么好。你要想使用最新的,你只能在他的服务器上使。以后呢,Meta估计也要走这条路。
那你说为什么没有人骂XAi呢?原因很简单,因为XAi一直就这样。从x开放出来的这个推荐算法,开放出来以后,就再也没有更新过任何代码。你提的所有问题,连回复都没有人回复。XAi更新出来的Grok开源模型也是如此,开源出来啪往那一扔,彻底没人理你了。所以它一直这样。
而LLAMA呢,原来是比较开放的。现在大量的模型都是在LLAMA基础上做出来的,包括Qwen早期的模型,都是在LLAMA基础上做出来的。那现在呢,有点越来越回去了,所以有点怒其不争。大家要骂一骂他,看看能不能把他骂回来。
然后另外一个,LLAMA4被人骂的原因是什么?他不支持MCP。现在是一个做Agent的时代,你不支持MCP,你模型能力再强,你也搞不定各种场景。现在即使是你使用GBT 4O或者GBTO 3这样的模型,你没有一些外接的组件,你根本就跑不出结果来。所以你不支持MCP,这事肯定不行。
还有呢,就是LLAMA对用户是有限制的。LLAMA虽然是开源模型,但是呢,不能进行商业使用。你只能拿去做研究。你说我拿这东西做商业使用了,对不起,你会收到律师函的。而且如果你是一个大公司,月活用户数超过7亿的公司,你如果想使用LLAMA4或者LLAMA早期版本,你需要向Meta做单独的申请。申请通过了以后你才可以去使用,否则不让用,就做了很多限制。
这个反面典型讲完了,咱们讲一讲Qwen3跟LLAMA4比较起来是怎么样的。Qwen3完全开源,你爱干嘛干嘛去,想怎么调怎么调。第二个,体积小,参数少,规格全,性能高。从0.6B就开始,所有的都给你发一遍,爱用哪个版本用哪个版本。这些小体积的模型,经过微调之后应该会一统江湖。
什么意思?就是现在在hugging face上,绝大部分的模型都是拿Qwen2.5、Qwen2这些各个尺寸的模型调出来的。
早期的LLAMA还是各个尺寸都有的。现在到LLAMA4,前面那些小的模型就不出了。Qwen3又把所有的模型都出了一遍,那大家就拿来微调呗。你说哪块不满意,我就专门把它调一调,训练一下上去使不就完事了吗?所以一定会一统江湖的。
而且,Qwen3是原生支持MCP的。我在本地部署了OLAMA 8B的模型,使用Cherry studio测试了一下,支持没有任何问题。但是呢,支持的并不是那么顺畅。30B和32B的模型我在本地也装了,完美支持MCP,没有任何问题。
那你说什么叫支持的不顺畅?什么叫支持的顺畅呢?在这跟大家讲一讲使用MCP的过程。其实很简单,MCP也是描述一下工具,说我这有一工具,这工具叫什么什么名字,输入的参数是什么,输出的参数是什么,能干什么。大概是有这样的一个描述文件,你把这描述文件给到大模型以后呢,大模型会根据你提出的要求,来生成一个调用这个工具接口的代码。
这个8B的模型呢,有时候生成的代码会有点小错误,导致呢调用失败。那调用失败了以后呢,他会换一个方式,再调另外一个接口,然后会得出一个需要的结果出来。你使用32B模型,或者30B的Qwen3模型的话,你把一大堆的描述扔给他以后,他就会正确的找到需要使用的接口,需要使用的工具,然后生成调用代码直接调。调完了以后得到结果,需要再调用的话,还可以在一次推理里头多次调用,然后得到结果。
因为我是放的高德地图的MCP进去,说来给我规划一个旅游路线,这个效果好极了。完完全全在本地,当然高德地图那个服务器不在本地。其他的,他的Qwen3,OLAMA,Cherry studio都是在本地跑起来了,所以这块效果好极了。
现在呢是大模型密集发布的一个周期。前面我们看到了Gemini 2.5 Pro,Gemini 2.5 Flash,GPT也在快速的连续发布。后边还会很快看到一些新东西,包括马斯克下周要发布的Grok 3.5。Qwen3出来以后,如果有哪些方面超越了它,那它是肯定是要更新的嘛。GPT5应该也快了,这就是这样的一个风起云涌的大时代。
好,总结一下吧。Agent时代一定要有一个对Agent友好的模型发布出来,才会被大家叫好,才算是一次成功的发布。体积小,参数少,规格全,性能高,只要可用性不退步,方便微调,这些特性都具备的话,再加上前面的MCP的功能,Qwen3绝对是一次划时代的成功。好,这就是今天讲的故事。
大家赶快去玩耍起来!好,感谢大家收听。请帮忙点赞,点小铃铛。参加DISCORD讨论群。也欢迎有兴趣、有能力的朋友加入我们的付费频道。再见!