浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
2025-06-26 11:29:00
原创 史中 浅黑科技 2025-06-26 11:29 北京
世界这么大,是否有一个银行敢借钱给普通人?
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
第一家敢借1块钱的银行,
如今活得怎么样了?
1992年,马云创办海博翻译社,就差三万块。
他花了3个月把家里所有的发票凑起来抵押,但还是没贷到款。
原因很简单,那时的马云还不是名人,只是和李云、王云并无区别的人名。
光看“人名”,银行怎么知道你有没有能力还上这三万块呢?要是派专员来调查你的还款能力,成本还合不上那点儿利息呢。
“把钱借给 Somebody 而不是 Nobody”,“借大钱不借小钱”,这是全世界银行的“祖训”,是颠扑不破的理性。
但真相的獠牙难以掩盖:
那些被轻描淡写掠过的,怎可能只是“人名”?
那更是一个个双脚扎在泥土里的活生生的人,是他们的尊严与梦想,渴望与不得。
世界这么大,莫说广厦万千,难道就搞不出一个肯借钱给小微企业的银行?
网商银行这群人,化身为鸟,盘桓十年,只是为了回答这句诘问。
2010 年 4 月 13日 凌晨一点半,王文强看着自己银行余额上刚多出的 1,陷入沉思。
“淘宝是不是搞错了?我就输了 1 块钱试一下,还真借给我?”
突然,电话铃响起,吓得他一激灵。
电话那头不是贞子,而是自称阿里金融的技术小哥:“你在我们这贷款了吗?”
“呃,我好奇试了下,只借了 1 块钱。。。”
“是是是我们知道只有一块钱,那个,速度快不快?流程卡不卡?有什么需要改进的地方?”对面激动的语气搅动着暗夜粘稠。
王文强其实没太搞懂,一个债主,借出了 1 块钱,为啥高兴得要咬人。
挂掉电话,他赶紧点鼠标,把那一块钱给还上了。“嗯,别说,操作还挺丝滑。”他自言自语。
王文强彼时并不知道,由于熬夜的特性和过于旺盛的好奇心,他的名字已经被刻在中国金融史的竹简上——在他之前,正规的金融机构从未做出过这么小数额的贷款。
别说 1 块,就是 100 块,1000 块,10000 块都没有,连 100 万以下的贷款都凤毛麟角。
此时把镜头切回杭州,一群年轻人正盯着屏幕,眼里闪着光。
数据库缓慢而坚决地滚动:
凌晨1:28 阿里金融上线;
1:31,第一个客户王文强的贷款获批,金额 1 元;
1:31,第二个客户陈辉的贷款获批,金额 1368.17 元。……
自那时起,这条小微金融之河就再没中断,奔流至今。
这是系统刚上线时团队发出的邮件
等等,好像哪里没说清楚!
那个曾经困住马云的问题,是怎么解决的?
王文强只是一个“人名”。你怎么保证他会还钱?
答案只有两个字:技术。
王文强没有抵押房产,也没有抵押家具,如果说他抵押了什么,那就是他的“订单”。
他是一个淘宝店主,每一单交易、物流和回款都记录在淘宝的数据库上,没人可以篡改。贷款系统对这些数据进行分析,就能瞬间评估他的经济能力,算出一个“安全值”,只要他的借款不高于这个值,就放心把钱借给他好了!
一整套操作,目标是三个数字:“3 分钟申请,1 分钟到账,0 人工干预”。
这也就是后来被行业奉为标准的“310 模式”。
310,现在你也许不觉得多么惊艳,就像每天用电的人不会对电灯亮起大惊小怪。但是,回到爱迪生的时代,当一个屋子被光芒点亮,人们会为时代的汹涌而热泪盈眶。
家里做生意的浅友可能还记得,15 年前,当你需要小额贷款救急时,只有两条路:找熟人借,看脸色;找民间借贷借,看纹身。
这两条路的综合成本(利息、人情、风险、时间)都高到疯狂。真真是见的人越多,就越喜欢狗。
回到历史的当下,那些技术人最凶悍的贡献,还不是创造了一套“社恐福音”系统,让商户们可以完全不用和任何人见面,靠点击鼠标就可以把钱贷下来;而是由于这套线上系统被纯粹的“数据和算法加持”,让每笔贷款的 IT 运维成本降低到了前所未有的 2 块钱。
相比之下,传统银行动不动就要派个人来线下评估你的资产,每放一笔贷款,人吃马喂的成本大概是 2000 元。
成本是世间最坚硬的卡尺,它阻止一切商业贴地飞行。
当成本降为原来的千分之一,自然能飞得更低,于是,你有机会发现那些沉默的、双脚扎在泥土里的,成千上万的人。
在阿里金融成立的最初五年,将近 100 万小商户从中贷到了 2000 亿元。平均每人贷款 20 万。
历史的拐点上,阿里金融用技术的追光打亮了“小人物”的同时,也在某种意义上增强了监管对于民营资本进入银行业的信心。
2014 年,中国首批五家民营银行获批,网商银行位列其中。那是个值得纪念的时刻,仿佛阿里金融拿到了“毕业证”,它将会从“小额贷款公司”进化成一家真正的银行!
但正如你我也经历过的那样:毕业的欣喜落定,漫长的生活拷问才款款而至。
架构师果郡惊呆了,他脑袋里盘旋着三个字——不可能。
从网商银行获批,到系统验收截止日,只有六个月的时间!
如果把小贷系统看作一个心脏,那么银行系统就是包含了五脏六腑的完整躯体,复杂度不可同日而语。
其实,如果购买市面上已有的传统银行架构,那甚至不用六个月;但要使用和小贷系统同样的“云计算”架构,半年绝对是不够的。
区别在哪呢?
传统银行架构是集中式的。
它像一个“人”,身上的零件是“强耦合”的,优点是信息在体内流转速度快,也不易出错。但缺点也很明显——人不能长太大,姚明那样就是极限了。
云上银行的架构是分布式的。
它像一群“鸟”,鸟和鸟之间是“松耦合”的,每时每刻,鸟群都可以根据需要变大变小,重新排列。
理论上,鸟群可以无限扩展,只要。。。你有办法控制和调度。
鸟群可以无限大
阿里小贷之所以能服务小微客户,是因为有巨大的数据系统,系统能低成本运转,靠的就是云架构。
虽然大家尚不能预测互联网银行具体会怎样运转,但直觉告诉他们:只要继续服务小微,用于计算的系统只会更大、更多、更疯狂。。。
自研云架构,无疑是对未来更负责的路线。但问题是,这玩意儿世界上就没人做过!如果研发时间太长,验收推迟,同行会不会看笑话。。。
团队激烈争吵,但最后还是“打”成一致:与(用最好的技术)帮助小微企业的梦想相比,面子算个屁!
开干!果郡至今记得,当时蚂蚁集团调集最精锐的师傅草创网商银行,一线核心架构师开赴杭州黄龙时代广场 15 楼闭关,史称“一号项目”。
但即使这样,从头构建一个浩繁的云上银行,人力也存在黑洞一般的缺口。
蚂蚁高层紧急决定,今年入职的新员工,全部拉上前线!还不够,就继续招人!
果郡当时身兼三职,一边研发核心系统,一边帮助审阅简历,一边培训新来的同学。就这样,两个月时间看了 6000 份简历,招进来 150 人。
这些同学刚加入,就被按在最硬核的云上银行系统摩擦,也算是开了天局。。。
云上银行要想稳定运转,不仅银行系统自己的代码要写得硬,底层支持它的云计算系统也得稳才行。
这正中了阿里云那群疯子的下怀。
彼时阿里云已经实现了“5K”和“10K”,也就是用 5000 台、10000 台分布式计算机支持一个系统。这帮人杀疯了,整天满脑子想的就是找个更地狱难度的局练练手——这一分钱都不能错的银行系统,简直是太~刺~激~了。
啥都不怕的云疯子、傻白甜的应届生、殚精竭虑的架构师,就是这样一群神奇的组合,在云上筑巢,召唤出隐天蔽日的鸟阵。
2015 年 6 月,网商银行敲锣打鼓,开门营业。
可等待他们的,却是一场漫长的围困。
果郡(右)与阿里云创始人王坚
2016 年冬天,高嵩的心情沮丧到了极点。
两年前,他带着一帮年轻人通宵肝系统,大家说好了要从阿里小贷拓展出去,服务更多普通人。
可开业不到2年,网商银行的客户就“见顶”了。
淘宝、天猫上有资金需求的商家,需要借钱的都借了,不需要借钱的,那就是不需要啊。。。
淘天商家,当时满打满算有个700-800 万,可飞到更高处观看:中国的小微企业+个体户有 9000 万。
如果不服务这 9000 万人,把银行牌照挂在墙上有何用?
话虽如此,但网商银行的同学有难言之隐。
之前说过,网商银行决定贷款给谁,贷多少,靠的是“数据+算法”。淘宝天猫商户的经营数据天生就在阿里体系内,只要用户一授权,就可以计算。
可是,几千万不在阿里体系内做生意的小业主、个体户,他们的经营数据去哪儿找呢?
高嵩记得,那时候他们做了很多系统,把工商税务的信息连接进来;还嫌不够,又联系了一些为企业做服务的平台,把他们的数据也接进来。
可如果把淘天的数据比作森林,这些外部数据就像是沙漠上的沙棘草——重要,但不够多。
数据的枝叶如果不是茂密到相互连接,算法就很难从中凝练出可靠的风控信息。
无数次尝试,皆以失败告终。
网商银行被围困在数据的围墙之间,使出浑身力气也无法推开石壁。
内部的噪音由弱渐强:“不如别折腾了,退回到阿里小贷算了。”“是啊,我们还是在服务小微嘛,对得起当年的承诺!”
我是为了见证一家伟大的互联网银行的诞生而来,而不是维持一个原本就运转良好的小贷业务。
如果业务无法突破,我留在这里的意义是什么?
这是更多人内心真实的诘问。
这是最初建立阿里金融(牧羊犬项目)时的签名T恤。
彼时,更多“看清了形势”的同事,拿完那年年终奖直接选择辞职走人,加入“更有希望的事业”。初创的网商银行迎来一场大雨。
可世间的玩笑在于:所谓的“看清”,永远只是聪明人的幻觉。看清了眼前高耸的墙,却不一定看见自己脊背上的翼。
2017 年 2 月,支付宝 App 首页 C 位,出现了一个新功能:收钱码。
收钱码如细胞一样扩散,大街小巷,包子铺、灌饼摊,“支付宝到账 XX 元”的声音开始此起彼伏。
没人预料到,正是这薄如蝉翼的二维码,成为了网商银行众将柔韧的翅膀。
原本在街头巷尾“隐藏”的商业活动,突然被数据照亮,城市的人间烟火,在赛博世界里喧闹盎然。
“码商”的每一次收款,都真实对应着卖出的一份煎饼,一屉包子。
虽然数额微小,却是活生生的数据叶片,这些叶片连缀起来,不正是刻画一个中小商户还款能力的参天大树吗?
很快,不少同事就进入了码商攻坚组。“多收就能多贷”,这是他们设定的原则。
高嵩(左一)和并肩作战的同事们。
但别忘了,简单的原则背后,靠的却是细碎的数据亿万相叠,在丹炉里重新熔铸。
站在这里回望, 你或许能理解之前写核心系统的那群架构师。
如果不是当年顶着延期的风险愣要建设“分布式核心”,此时即便有了收款码的爆发,网商银行也没有办法接住这“泼天数据”。
飞越淘宝的围墙,进入城市的街巷,仅仅在 2017 年一年,网商银行服务的小微数量就翻了 7 倍。
这当然是凶狠的成功,但飞得高看得远,网商银行这群人打起了寒颤,他们看到了远处广阔的“荒原”。
中国并非只有城市,甚至城市并非真的中国。
2017 年,韩文婧加入网商银行,负责“算命”。
她那时在视频核验组。当风控系统没有足够信心判定贷款风险时,并非直接拒贷,而是让人工辅助:
通过视频和贷款人聊天,再结合贷款人的资料,敲定贷款金额。
可想而知,能到韩文婧手里的,一般是比较“棘手”的贷款,其中大多就是农户。
但是,每当她点开农户的征信资料时,系统返回的永远是——空白。
这并不意外:很多农户没上淘宝卖过东西,没有支付宝,甚至没有智能手机,银行账户一年也不动几笔,哪里来的征信?
韩文婧非常困惑,于是请教资深风控老同事咋判断,老同事挑挑眉毛笑着说:看面相!
搞金融带算命可还行?!
就在韩文婧蒙圈的时候,其实已经有一支小分队悄悄进了村。
网商银行人手有限,于是委托了“农村淘宝”的几位小二做试点,在推广淘宝下乡的过程中,顺便看看有谁需要金融服务。
小二们基于自己对农村的理解,在脑海里画了个关系图:
农户的种植养殖,大多是由一些乡镇企业组织的。企业负责给农户“布置任务”,到时候再来收购农产品。
这样看来,乡镇龙头企业应该靠谱!
于是他们选了一些前两年经营数据不错的企业放了贷。
可是,转过年来,小二们傻眼了:
不少龙头企业都出了经营问题,还贷困难。。。
网商银行紧急复盘,感觉有两个大问题:
第一,贷款不够下沉。形态各异的农户是农业的细胞,资金给到他们更能对冲风险;
第二,数据不够实时。农业受自然影响,前两年收成好,并不意味着今年也好。。。
看来,坐在办公室里永远搞不清土地上的事儿,必须亲自穿行山河,探个究竟。
韩文婧就在这时被调入了农村金融团队。她本人长在城市,跟种地唯一的联系就是爷爷在农业局做了一辈子植保工作。
魔幻的是,团队里有海归精英,有优渥的城市二代,就是没有农民的孩子。
这样一群人像麻雀,叽叽喳喳飞进大小乡村,开始闯关打怪。
韩文婧第一次知道了土豆的种子还是土豆,知道了番茄要掐秧,知道了水稻油菜最好轮作,玉米和大豆应该套种。
她记得清楚,探访一家养殖户,一进门人家就把紫外线灯打开,生怕他们身上带了神马病毒对二师兄不利。因为这些猪就是他们的全部。
埋在浅土里的线索被提起来,一张网逐渐抖落尘埃。
农业最锋利的数据是什么?
就是此时此刻,庄稼的长势!
2020 年 9 月,网商银行自研的“大山雀”卫星遥感风控系统上线。
卫星掠过土地,可以识别农作物的面积和长势,再加上气象数据、地理数据、行业宏观数据,放在大数据的熔炉里炼制,一个授信值就能被计算出来!
从这一刻开始,人类从漫漫黄土地里刨出来的,不只是果实,还有数据。
而且数据还会随着技术的进步不断丰富。
在接下来几年里,网商银行的技术同学通过升级大山雀系统,让它精准区分了水稻、小麦、玉米,识别苹果、柑橘、梨、大棚蔬菜等十几种主粮和经济作物。
在卫星图上用 AI 标记作物的实时生长情况。
截止今天,大山雀已经帮助了 181 万农户获得信用贷款,其中 8 成以上都是“征信白户”。
风控终于不用再“算命”了。。。
从 2020 年起,农村金融团队的同学们再没有离开土地,他们走遍了中国所有的省区和作物产地,每个人说梦话都能背出自己负责的作物的生长周期、地域分布和农时节奏。
韩文婧也“膨胀”了,敢和爷爷探讨他的专业了!
新中国刚成立时,爷爷为了帮农民灭虫,自己用天平调试剂配方,如今他已经 98 岁,那些早已成为往事追忆。但他的孙女却用另一种方式接续了他的事业。
在日记里,爷爷写下了一句话:文婧转到农村金融部门做工作了,农村金融好,利国利民!
韩文婧和爷爷
李网靠在飞机舷窗边,无心看脚下壮美的草原,满脑子盘算的都是这一来一回的路费。
他是蒙牛经销商,做的事情再简单不过,从总部进货,然后分销给大小杂货铺。
他开的这种公司,有个意味深长的名字:供应链企业。
这一“链”,就说明上面有一环,下面有一环。
上面,总部不给赊账,需要现钱进货;下面,杂货铺经常欠款,拖几个月、半年也不新鲜。
这中间的空档期,李网就得自己找钱“过桥”。
他联系了当地一家传统银行,确实拿到了贷款,可是人家有条件:必须拿来你和总部签订的经销授权合同,我们才放款。
于是,李网只好每年一次,从江苏飞到内蒙,飞越 1500 公里和蒙牛面签合同,一次来回就要五六千。赶上疫情,还有各种不便。
李网越琢磨越不对劲:“我每天的经营流水都在这,咋就非得看这个合同?”
李网
他把这个疑问抛给了所有能接触到的银行人员,也包括网商银行产业链金融的负责人卓谦。
卓谦和团队发现,表面上这是一个“风控模型”问题,可往深看,这是一个“思维模型”的问题。
产业链的标准模型是“1+N”,也就是一个核心企业和 N 家上下游供应商,在风控的概念空间里,N 的信用都依赖于 1 而存在。1 之不存,N 将焉附?(所以必须看经销合同)
但只要深入这些企业就会发现,这个模型非常片面。
供应链企业,怎可能只和这个 1 发生联系?它还可能和其他企业有关联,也有大量以自己为中心的资金往来啊。
所有的这些资金流,应该合并计算为这家企业的信用才对!
这个思路并不难,为啥没有银行按照这个思路做呢?
还是那两个字:技术。
分析这种密如蛛网的资金联系,需要用到一个高端黑科技——图数据库。
就在 2021 年, 国产图数据库迎来了大突破,而一举攻下技术高地的不是别人,正是网商银行的股东之一蚂蚁集团。
我在另一篇文章《支付宝抓骗子》里曾经详细介绍过,蚂蚁集团的图数据库可以用极低的成本,跳跃六七层资金活动,分析主体间的真实关系。
网商银行把诸多小企业提交的资金流水用图数据库综合分析,一个清晰的“产业之网“舒展在眼前。
这个“网”比“链”的信息丰富太多了——从任何一家企业出发,都能看到细密的蛛丝,它不是别人的附庸,它就是它自己!
卓谦把这种根据供应链中小微企业自己的信用给予资金支持的模式称为:1+N²。
这套专门在空中俯瞰资金流的蛛丝马迹,进而为小企业刻画关系网的系统,被称为“大雁系统”。
但与此同时,团队又遇到了一连串新问题:
企业为了争取更高授信额度,会提交各种资金流水:
这些单据来自大小银行,甚至村镇银行;
除了银行流水,有人还会提交微信支付对账单;
有人还会提交购买设备的单据,甚至也有和当年马云一样提交家具发票的。
如何把海量单据里的信息完整提取出来?如何判断这些单据的真伪?
“只有靠人工智能。”贾楠说。
贾楠是网商银行的风控策略同学,数理经济学毕业,数据和算法是她的武器。
当时还没有大模型,不过她完全相信人工智能有能力理解这些单据的信息,但前提是:你要给它看足够多的单据,让它学。
正所谓有多少人工才有多少智能。
贾楠和组里的伙伴为了获得不同银行流水单,肉身出现在所有能找得到的银行里,人均开卡恨不能凑够一副扑克牌。
他们真是开了眼了:
各个银行流水单的格式简直奇思妙想,五花八门,有的字体颜色极为诡异。。。
但世上怕就怕“认真”二字。
系统把流水单里的信息提取越来越全,越来越准,对伪造单据也能做到“一眼假”。此时,这套系统终于可以拥有最高荣誉——获得一个鸟类的冠名了。它被称为“百灵系统”。
你也许猜不到,网商银行的风控策略团队只有 5 个人,这五个人面对的超过 1 亿的小微客户窗口,其中真正服务的也有几千万之多。
贾楠算了一下,百灵系统部署后,仅仅一年就有 423 万客户用各种单据实现了“提额”,这个任务交给任何一个人类团队,都需要十年才能完成。
小企业提额背后,是更深的商业变迁:
所有企业,在享受金融服务之前,都要回答一个问题:我是谁。
但“我是谁”有无数种答案。我可以是某企业的供应商,可以是某供应链的一环,但所有的回答中,最有尊严的便是:我就是我!
由此观之,网商银行的大雁、百灵,这些飞鸟们所做的事情,难道不是为人重新定义自己的尊严而衔泥筑巢吗?
彼时,网商银行终于可以骄傲地宣布,自己已拥有一颗跳动的心脏。能把血液精准泵入经济最细微的毛细血管!
但正如人体循环,心脏泵血出去的时候,也要有血液填充进来。
这,就是理财。
“能不能把收益往下拉一点儿?”
“你说啥?”吴迪以为自己听错了。
吴迪是信银理财互联网营销负责人。日常他会和很多银行对接,把自家理财产品放在对方的平台销售。
可网商银行这么奇葩的要求,还是第一次听到。
理财行业有个潜规则,就是在理财新品上线时,先把产品收益调高一些,吸引用户进来,过段时间再悄悄调低,让整体收益平衡。这个操作被称为“打榜”。
网商银行的意思是,咱能不能不整这些虚的,能赚多少就标多少。
这么做,出于特别的考虑:
小微企业在网商银行借钱,有了结余的利润也会放在这里赚收益,本质上,这些理财收入也是企业总体利润的重要组成。
但小微企业利润薄,风险大,平时最怕的就是“失控”二字。
冲着高收益去了,结果后面收益骤降,没赚到预期的钱,很可能全公司的计划都被打乱了呀!
注意,把“收益拉低”,可不意味着客户实际上少赚钱:
之前打榜的理财产品,刚上线收益是 100 分,过一阵儿调成 60 分,甚至 50分。
现在网商银行的要求是:别到 100 分, 也别到 60 分,就稳稳维持在 80 分!
这就像血糖一样,忽高忽低那不难,保持稳定才考验体魄。
为了增强稳定性,吴迪只好说服同事们为网商银行重新设计理财产品。
像这样“龟毛”到吴迪想打人的事儿还有很多。
比如很多浅友都买过“封闭型理财”,例如封闭7天、14天、30天,然后就能取出。这种理财适合大多数人,但未必适合小微企业。
很多小企业要在每个月固定的日期用钱,例如发工资、付租金。
假设企业每月 10 号发工资,现在是 1 号,有一笔闲钱,你说该投 7 天还是 14 天?
开工资可不是开玩笑,一秒都不能耽误,这种情况只好投 7 天,后面几天在活期里低息凑合一下。
这么一来,资金利用效率就没有达到最高,企业的利润也会少那么一些。
网商银行这群师傅就是龟毛到连这么一点点利润也想帮小企业争取出来。
于是在 2024 年的外滩大会上,他们和信银理财发布了日申月赎型产品“月利宝”,每天都可以存,每月固定时间取!这不就和小企业的节奏合拍了吗?
发布会上大家一脸兴奋,吴迪却是一圈儿熊猫眼。
因为就在月利宝上线前几周,网商银行还提了一个更龟毛的修改意见。。。
如果月利宝赎回日正好赶上了周末,咋办?周末银行系统都休息啊,当然是顺延到周一把钱给你。
网商银行说:不行。
周末银行系统休息,没问题,但你可以在周五的时候把人家要取的钱准备出来呀!
吴迪脑袋死机了,我周五就能知道客户周六周日取多少钱?
呵呵,如果不能预测未来,算什么科技银行?!
就在焦灼的时刻,网商银行上线了“布谷鸟系统”,布谷鸟可以根据客户的历史数据,预测它在下一个开放周期的取款数额。
当然,单个客户预测未必准确,但是无数个客户的预测叠加在一起,就会总体上平抑不确定性,达到相当精准的程度。
有了布谷鸟的预测,巨浪被消减为柔波,理财公司受到的冲击大大减少。由此,他们也有了底气,说是哪天赎回,就是哪天给你,一天都不耽搁。
数字是最好的勋章:信银理财和网商银行合作五年,代销理财余额从 0 涨到了 1000 亿元。
有这 1000 亿打底,吴迪看网商银行这群龟毛同事也眉清目秀了许多。
有趣的是:同一个人,既可能贷款,也可能理财。只是 Ta 的贷款和理财发生在不同的时空。
金融表面上是让“远方的他人”把钱借给“此地的自己”;
但换个角度,它似乎与别人无关,只是让“未来的自己”把钱借给“现在的自己”。
如此看来,网商银行像一只大鸟,冲上时间和空间的云端,在巨大的尺度里穿梭腾挪,平抑着资金的成本,让未来的我有机会拉现在的自己一把。
这也许是科技与金融能编织出的最深善意。
“10分钟后开电话会。”
大年初一晚上11点,无恤正陪孩子玩耍,突然手机叮当作响。
他被拉进一个新组建的群,里面是这行不容辩驳的文字。
这不是普通的大年初一,这是 2020 年的大年初一。
疫情爆发,千里之外的武汉街巷封冻,年味尽消,只剩火神山医院的建设队伍昼夜轰鸣。
放假的员工们还心存一点好奇,心里念着推迟的复工;可是对于武汉大小商家来说,被封冻的是他们赖以生存的现金流。
网商银行开启了紧急作战计划,要为受疫情影响的武汉商户发放限时无息贷款。
这个项目,也被称为“火神山项目”。
无恤被指派为项目负责人。他当然清楚,按照惯例:利息策略的调整、贷款对象的变动、风控策略的联动,都要经过多轮测试,灰度放量,最后才算正式上线。
但武汉商户等不起。
生意收入为零,可房租之类的固定支出每秒都在流出。封城超过一周,就会有大量的商户被拖垮。
火神山项目要求,96 小时就要上线!
一个个钉钉群被组建,散落在天南海北过年的同事们通过网线神元归位,开始了这场四天四夜大接力。
按照规矩,新的贷款产品开发,必须经过多轮质检测试,确保排除 Bug 才能上线,但现在显然不能讲规矩了。
研发同学们开始了“无保护编程”。
打个比方:日常代码开发就像运动员训练,旁边的教练就是质检团队,负责保护运动员,哪怕失误了也会被扶住,基本不会受伤;
火神山项目,就像是上了奥林匹克赛场,没有任何保护,一旦失误就可能严重受伤。
此时依靠的,只有十年如一日的训练,只有深入骨髓的肌肉记忆。
无恤在2007年就加入了阿里,是阿里金融的初创成员,他见证了最早一批贷款发放时同学们的欣喜,见证了大家面对数据之墙时的茫然和飞越。
他明白,眼下自己正在创造的一切,也将继续写入历史。
任何一行代码,都错不起。
为了集中精神,很多同学都把自己关在书房、阳台,有些怕被孩子吵到,直接进衣柜里开电话会。。。
线上语音电话几个小时不断,噼里啪啦的键盘敲击被窗外的爆竹淹没。
96 小时后,火神山项目如期上线。前三月免息,后九月利率下调 20%,在快要窒息时,小微商家们得到了氧气。
无声处,是喘息。
现在回望,一切焦灼的当下都变成了可以平静追忆的历史,但火神山项目却并未随记忆封尘。
它虽是紧急项目,却并非临时工程。
无常是人间的主旋律,困境会不期而至。
网商银行把火神山项目进化成了更多的“助微计划”,在各种突发事件降临时,肇始于 2020 年的框架仍会被召唤出来,为更多小微企业输送宝贵的氧气。
创业者面对霹雳荆棘,难免受伤。
金融时常可以成为一种护佑,让受伤的鸟不坠落。
十年弹指挥间。
2025,网商银行十岁。
当年招来的应届生,不少已是砥柱中流,也大多为人母父。生活的艰辛,平等地刻在每个人脸上。
所有人都比以前更加确信:
那些宏大的故事固然精彩,可父母孩子的三餐食材,手头腾挪的三两万块,这些小事才是每日顾念,心头温热。
所幸,他们所经营的事业,正是在为世间“小事”而尽心尽力。
无数个清晨,他们穿过街巷,身侧传来一声“支付宝到账5元”,或许这就是一种提醒。
氤氲的雾气中,包子店老板夫妻在揉面,这些面团里不仅装满可口的馅儿,更装满普通人对生活沉甸甸的期望。
抬眼望,街两边无数店铺洞开大门,它们何尝不是一个个渴望被倾听的故事。
那些平凡的故事,在行至艰难情节时,若能因一家愿意护佑普通人的银行而峰回路转,会是多么甜啊。
为了这些“峰回路转”,网商银行的这群师傅又脚下生风。
韩文婧忘不了那一幕:
有一次,她和同事去农村调研,路过临沂。看地图导航,距离黄河咫尺,于是一行人决定忙里偷闲,绕道黄河看一看。
没有想象中的林木遮蔽,母亲河就这样蓦然奔流至眼底,两岸的山脊显露,那是河水万年背负而至的黄土。
猝不及防,一种怆然降临。韩文婧感觉自己像已在此地矗立了无数春秋,见证了普通人的劳作与生息,沉默与歌唱,诉说与渴望。
正是这些细小到无声无息的普通人,如沙粒一般,堆叠出这片土地千万年的温婉长歌。
“做这件事,也许图的就是这样的时刻。”
她说。
告别这群人,回程的飞机上,我看到脚下一望无际的稻田。劳作的人们,远如蝼蚁。
当你的双脚深深扎进泥土,动弹不得,曾渴望一只鸟衔来甘露吗?
我所知,有人愿以身为鸟,飞越千山,栖于田野,听风低吟,饥餐渴饮,夜宿星光。
在云雾遮蔽的子夜,也会害怕黑夜暗袭。
但我猜,他们仍会安眠,因为脚下土地宽广,皆是他们的家。
往期推荐:
👉当 AI 成为“逆子”:人类该抽丫俩逼兜,还是给它一个拥抱?
👉支付宝有多狠?当年为抓骗子搞出“图计算”,现在竟用它预测未来
鸿雁于飞
萧萧其羽
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
2025-06-13 10:59:00
原创 史中 浅黑科技 2025-06-13 10:59 北京
下次遇到 OPPO 机主,记得给Ta点个赞。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
卖手机的 OPPO,
偷偷干了件让全世界付费的事
文 | 史中
“你们这些小屁孩,知道我是谁吗?”一位美国大叔拍案而起,皱纹拧成大写的鄙视,白胡子颤抖。
像他这样造型的,旁边还有七八个。
谈判桌对面,是清一色的中国人,平均年龄恨不得比他们小两轮。
“怀疑我专利的含金量?通信标准会议,每一个我都在场,你们谁参加过?”
大叔继续贴脸输出,越说越激动。
“专利的成色只能用技术证明,而不是资历。傲慢只会让你失去尊重!”一个戴眼镜的中国小伙儿不卑不亢地还击。
大叔有点儿断片儿。。。
诶,之前跟“那些人”这样说,对方气势会立刻矮一截,怎么这次剧情要跑偏?
时间暂停,我们把镜头拉出窗外。
这里是深圳湾地标“春笋大厦”。
2024 年,美国高通代表团磨刀霍霍来了十几个技术专家、谈判高手、专利律师,杀到 OPPO 续签专利合同。
高通,不用介绍, 当今手机芯片一哥,作为行业上古神兽,几乎半部通信史都和它相关。任何一部手机里,密密麻麻都是高通的专利。
用我专利得给钱啊!
所以他们的目标很简单:我来了,我收费,我回家。
但 OPPO 的意思是:朋友坐下饮茶先,我 OPPO 是用了高通专利,但你高通也用了 OPPO 的专利。咱们得“交叉授权”,你的专利费减去我的专利费,剩下的差额才是我要给你的钱。
于是问题复杂了。。。你的专利值多少钱,我的又值多少钱?
按照国际惯例,此时双方得“辨经”。
具体是酱的:
1)分别从自己的专利里粗筛出几百件;
2)然后“抽卡”,我从几百件里自己抽几十件最能打的,再让你抽几十件觉得最弱鸡的。你那边也以同样姿势抽出几十件;
3)这些专利,咱们一件一件抬上桌面,跟鉴宝节目一样,辩论它到底值多少钱!
高手过招嘛,点到为止。
辩完一轮,对方什么段位,两边心里都有了谱。再谈钱,就更容易体面地达成共识了。
可想而知,这种辩论很容易被玩坏,变成大型 PUA 现场——为了让对方相信他们的专利没那么值钱,那真是各种“迷魂汤、听话水”都使绝了。
美国大叔说话这么难听,难道不就是一种 PUA 吗?这种关头,但凡气势弱一点儿就败了呀。
必须主打一个不惯着!
当然,以上这个画面,是中哥我合理想象的。
因为墨东行在“辨经”桌上每次都是这么反击的。
之所以这么刚,是因为他在 OPPO 专利团队里负责最神秘的部分——专利的申请和战略布局。每个专利都是亲生骨肉,被你美国老头说歪瓜裂枣,那洒家跟你拼了。
我们知道和国际大厂的专利实力有差距。但我们要证明的是,这些年的努力有价值!
他用加粗红字说道。
看到这,可能有人嘀咕:OPPO。。。有啥专利?
大部分普通用户确实更关心手机的功能,不太研究背后的专利江湖,这不怪你。
但业内人士会告诉你:最近几年,OPPO 杀疯了。
2024年,高通在“5G 标准必要专利”榜单上排名全球第二,OPPO 已经冲到了全球第八。
而且过去几年,全国企业专利授权量总排名,OPPO 动不动就能进前三。
比榜单更确凿的认证,是对手的反应:
那次谈判的结果虽然保密,但是从各方透露出的蛛丝马迹来看,最终 OPPO 拿到的是非常满意的结果。
OPPO 做对了什么?
谈判,拍桌子瞪眼固然有点儿作用,但正如那句名言所说:战场上拿不到的,谈判桌上也休想拿到。
在 OPPO 专利团队的小伙伴看来,这场谈判只是厚厚相册中的一帧,驻足回望,来路是细碎的脚印,十一载风雪长歌。
老规矩,为了让你能品到妙处,在讲故事前,先来一段画小人科普,看看“专利战国”的烽烟。
咱们不妨把手机的生产想象成“炼金术”,每一个必要技术都像一种“矿藏”。
现在,假设我要造“中哥手机”,得先派好多支小分队去采矿。
可是我来得晚,很多重要的矿脉已经被别人占领了,还在门口立了个收款码。
我要进去采,就得付钱——这就是专利费。
一看价,倒吸一口凉气:这么贵呀!!
这个时候我就得算账了:要是都按他们的*要价*交费,那手机生产出来,卖一台赔一台,这不科学啊。。。
我咋办?
有三个选择:绕、谈、打。
1)绕。
这个 A 矿要价高,我能不能绕过去,找一个 B 矿来替代你?
哪怕 B 矿成色差一点儿,但不用交费啊,对我来说也是大大的划算。
这是个拼硬实力的活儿,假设我真能找到替代品,那您爱要多少钱要多少钱,要得越高越好呢!(因为其他友商可能绕不过去,还得给你交钱嘛)
2)谈。
这 A 矿我是真绕不过去。
商量一下,您给个诚心价!
注意,不是“求你了,便宜点儿,我上有八十岁老母。。。”这是乞讨,不是谈判。
真正的谈判,本质是交易。
就像咱们刚讲的“OPPO VS 高通”,高通手里有 OPPO 要的矿,OPPO 手里也得有高通要的矿才有的谈。
3)打。
这个矿我真绕不过去,您还不降价。咱俩杠在这,那就只能撕破脸,撸胳膊挽袖子打一架了。
不是真打,是“打官司”。
一般来说,“矿主”会先动手,起诉我侵权。这个时候,我除了直接抗辩说不侵权,还有两个选择。
第一,打无效。
就是干脆在法庭上证明这个矿不是你先发现的,你都没有权力收费!
为此,我需要在浩瀚的历史资料里找证据。但凡发现在公共媒体、公开出版物上,有人比你先提出了这个想法,那对不起,你的专利就无效了。
别说跟我收费,以后你跟谁都收不着费了。
第二,打反诉。
你说我侵权你,你还侵权我了呢!
这个时候,就要仔细检查对方的产品,看他是不是也在偷偷地采我的专利矿。
如果证明有,那即便另外的案子我输了赔你,这个案子你还得赔我,算总账谁给谁还不一定呢!
OK,“绕、谈、打”的基本操作说完了。我们不妨飞到空中,俯视一下 2025 年手机世界专利的“矿脉图”。
手机里,最值钱的专利大都集中在一个地方:蜂窝通信。也就是我们常说的 3G、4G、5G。
3G、4G 的地盘,几乎被外国公司瓜分。比如高通、诺基亚、爱立信、三星、LG,这些老牌通信企业。
5G 的地盘上,虽然上述外企依然盘踞半壁江山,但另一半已经被中国人抓在手里。2024 年前十名里有五家中国公司:
华为第一、中兴第六、OPPO 第八、CICT(中国信科)第九、vivo 第十。
这说明啥?
这些年咱也置下产业了!顶尖中国企业正从花钱买矿的人,逐渐变成开矿的“煤老板”,从交钱的变成收钱的!
但是,正如战国竹简中所一再书写的:
新王崛起,带来是昔日霸主的觊觎、争斗、心理失衡、霸道的防守、血腥的战争。
OPPO 的知识产权部部长枫盈,亲眼见证了这段历史。
或者说,他亲手参与缔造了这段历史。
时间之风逆流,回到 2014。
枫盈从 OPPO 的办公室走出来,回头又瞄了一眼公司 LOGO,心里直犯嘀咕:“这公司什么来路,怎么舍得在专利上投这么多钱?!”
那真是青涩的时刻呀:OPPO 在很多人心里还是个小厂,枫盈也只是一个默默无闻的专利律师。
但二者走到一起,不能说偶然。
短暂交谈,OPPO 的管理层听懂了枫盈的“大设计”:
作为工程师,枫盈曾经在中国联通一线写过多年基站代码;作为专利律师,枫盈曾在华为做过专利的申请、谈判、诉讼一条龙。
脚踩技术和法律的交叉口,他知道二者的咬合关系——只有把“技术的子弹”用正确的姿势填进“法律的弹夹”中,你才能拥有能打的“专利武器”。
但是!顶尖武器≠战争胜利。
你还得用一系列“军事理论”把战争组织起来:
像管仲一样对专利长期经营,像孙武一样上攻伐谋地诉讼,像苏秦一样纵横捭阖地谈判,才能在残酷的专利战争中挺到下一集,再下一集。
“专利武器”+“军事理论”,在枫盈看来有点像“老中医”,非常吃经验。西方花了几个世纪才演化出来这一整套玩法。
曾几何时,中国人只有“照猫画虎”的份儿。
回到 2014 年,中国通信公司把这些玩明白的,恐怕只有国际化比较早的华为、中兴、富士康这几家,一只手数得过来。
他们算是本土专利江湖的“第一代掌门”。
OPPO 邀请枫盈过来,就是看重华为的江湖地位,让他把在华为习得的真传在 OPPO 开枝散叶,帮助 OPPO 成长为第二代掌门。
OPPO 的企业文化是本分,而本分的表现之一就是“让专业的人做专业的事”。
过去十一年,我给领导层展现专业,领导层给我充分放权。这两件事不断重复,才有了 OPPO 专利今天的版图。
枫盈很感念。
但所谓专业,可不是光吹刚才那一套“大设计”就够的,更重要的是把这套设计和一样“俗气”的东西挂钩,那就是——钱。
专利申请要花钱。
同一个专利在不同国家申请要分别掏钱,专利每年还收维持费,在不同国家维持就更贵了。这些加起来,是一笔不菲的开销。
但是专利也能挣钱。
比如可以直接把专利卖掉,还可以和别人进行“交叉授权”抵扣专利费,更可以直接授权给别人收专利费。
如果剥离了情感因素,专利可以看做一个极简单的生意:
进项>出项=赚钱
进项<出项=赔钱
枫盈深知这一点,才对老板郑重承诺:专利团队的价值,早晚会落实到钱上。
如此,他为 OPPO 未来 15 年设计的“专利战略”就呼之欲出了:
1)用 5 年时间,把专利数量搞上去,起码不会被别人“专利挟持”。
2)再 5 年时间,把专利质量搞上去,可以大幅抵扣专利支出。
3)再 5 年时间,把专利运营搞起来,让专利直接给 OPPO 赚钱。
就在这么清晰而宏伟的规划下,OPPO 专利团队浩浩荡荡上路了,彼时团队成员是——两个人。。。
“充电五分钟,通话两小时!”
这个广告语,如今已经和“大宝天天见”“恒源祥羊羊羊”一起配享太庙了。
枫盈刚来时,OPPO 正好研发出了领先同行两代的快充技术,工程师们也张罗着申请了专利。
但看到专利申请材料,枫盈心里咯噔一下:这么说吧,水平高一点的友商完全能做到不给你交专利费,你还打不赢官司。
幸好专利材料递交的 12 个月内还可以补充修改,他把这些专利拿回来,细密织补了一遍,滴水不漏再提交。
事实证明,这么一个小操作,日后帮助 OPPO 渡了一劫。
这是那支入典的广告。
但当时,枫盈顾不上想这些,他面前是一片让人窒息的“5G 专利荒漠”。
5G?很多同事一脸问号。要知道,当时 4G 手机才开始普及。5G 得到猴年马月呢。。。
但枫盈知道,就算这一秒出发,也根本不早了,隔壁老东家华为已经系统级地启动了 5G 技术的研发和专利申请。
如果不在 5G 标准制定的过程中就强势参与、跑马圈地,真到了 5G 时代,矿都被别人占完了,OPPO 光是专利费就得交到吐血。。。
于是他三天两头跟老板蛐蛐,解释国际标准组织 3GPP 制定的时间表,技术研发会比正式商用提前十年甚至更多。
老板听劝,让他正式启动 5G 专利的整军备武。
3GPP 的路线图,5G 的研究准备从 2010 年就开始了。
很快,公司设立了“专利奖金”,技术部门的 5G 研究如果最终申成了专利,那是真给钱啊!工程师们于是踊跃地输送弹药。
2016 年加入的墨东行就是“装填手”,负责把师傅们的弹药填进专利申请书。
问题很快出现了:申请书一股脑怼到专利局,好多都批不下来。。。
这是为啥呢?
我们沿用之前“矿脉”的比喻。
你发现了一个矿,申请专利保护的同时,必须写明白保护范围。你不能说“以这个矿为圆心,周围一千公里都是我哒”。
举例,你去专利局申请一个专利:“两个轮子的载具”。那一下子把自行车摩托车手推车都给包括了。审查员一定会说:好走不送。
所以,要想专利被通过,必须把范围写得足够小;要想专利不被绕过,又得把范围尽量写大。结果就是:足够小的情况下尽量大。(你品品)
专利界有句老话:写专利申请的难度,并不亚于技术研发本身的难度。。。
就这样摸石头一两年,大伙儿总算踩准了鼓点儿舞起来,OPPO 的专利开始以每年几千件的速度累积。
但这只是基操。
“专利申请的高阶技能,在于动态布局。”墨东行提醒我。
想想看,全世界做 5G 研究的都是顶级聪明的老表,你跑马,人家也在圈地呢!
这像极了围棋:
你占了一块地,人家马上会想办法突围。你刚花重金修了坚固城池,回头一看人家从旁边修了条高速路。。。
反过来说,有的专利一开始看起来位置偏僻、平平无奇,可是随着技术演进,主干线突然向这里改道,它反而变成了一夫当关的要冲。
所以,专利申请组的同事们每天的工作就是“下一盘大棋”:
时刻跟踪技术的动态,在重要的专利周围申请更多专利,形成整片的“专利族”;
也适时放弃一些专利的续费,控制成本。
以上说的还只是“中国棋盘”。
专利只在注册地有保护作用,你想把手机卖到国外,就要去海外重新申请一遍。
技术专利有“优先权原则”,也就是 A 国认定的专利最早提交时间,B 国专利局也认可,(一定时间内)不用担心被人抢注。
但问题仍出在“钱”上:中国申请一件专利大概几千块,可欧美申请一件就要几万块。像 OPPO 这样专利太多的话,全部“出海”就不划算了。
这个事儿,倒逼团队建立了一套“专利分级体系”。例如:
一个顶级专利,要在全世界30多个主要国家全部注册,耗资几百万;
一个上乘专利,就在中美欧注册,耗资十几万;
一个普通专利,就在中国注册。未来随着技术演进,这个专利的等级调高,再去美欧注册不迟。
有了分级体系,OPPO 的专利从最一开始蜂拥而上的“古惑仔”,逐渐升级成列装整齐、层次分明的“集团军”,武力值大幅上升。
事实证明,哪怕眼前的光景再和平,战争的准备也不嫌太早。
就在专利大军集结的过程中,炮火声已轰然压来。
“听说了吗?我们在印度被告了!”
“谁告的?”
“杜比,说我们侵犯他们的音频压缩专利,索赔好多钱。。。”
2016 年底,坏消息在工程师之间传开,很快公司就确认了这个事实。
彼时 OPPO 手机出海步伐刚提速,主攻东南亚和南亚。吆喝没几声,手机没卖几台,后脖颈就遭了一闷棍。
“平事儿”的责任自然落到了知识产权部,具体来说,是诉讼团队的隽竹肩头。
在飞往新德里之前,她有三个星期时间搞清状况。
隽竹抱着电脑找到音频工程团队,还没开口,同学们的自责已经奔涌而出:
怎么还给搞侵权了呢。。。我们。。赔得起吧?
隽竹震惊,虽说 OPPO 的企业文化是本分,但是眼前的伙伴,也过于老实了。这还没辩,自己就准备掏钱了。。。
这也不怪小伙伴,放眼中国文化,打官司从来不是一个光彩的事情,无论是被告还是原告。好像惹上官司人就不干净了。更何况中国人做生意本就讲究和气生财。
她赶紧给小伙伴科普专利世界观:“被起诉”不等于“侵权了”,就算交钱,也不是人家要多少我们给多少,必须打出一个合理的价格。
不仅基层弥漫着不安,决策层也是第一次面对国际官司,有种“是不是哪里做错了”的自我怀疑。
枫盈跑到领导那,用专业知识搓出三颗“定心丸”开水送下:
1、通信行业被称为“专利丛林”,谁都无法预知会踩到谁家的雷。所以业内的规矩是:我放心做产品,你觉得我踩了你的专利,得主动来找我要钱。如果价钱谈不拢,起诉我是你的天赋权利。
2、这意味着,所谓“侵权案件”和“刑事案件”完全不同。它无关道德评判,只是某种分歧。解决分歧事在人为——法庭外的案头和法庭内的辩论,对结果的影响是极大的。
3、收专利费要付出谈判、诉讼的成本,持有人自然不会和小厂纠缠,OPPO 被起诉,说明我们段位够了!这不是个甜蜜的烦恼吗?
就这样,草创不久的专利团队一边给上上下下做心理马杀鸡,一边高强度准备应诉材料。
飞机缓缓沉入南亚次大陆。
进入法庭,隽竹一瞬间不知该哭该笑。
法庭几乎和街道上的民房一样简陋,屋子里人挤人发出嗡嗡声响,活像小学生的教室。
法官说话也不太听得清,以至于律师都冲上“讲台”跟法官面对面嚷嚷。
“这么魔幻的法庭,审理这么专业的案子,到底会是啥结果?”好奇心甚至已经盖过了她的焦虑。
但几天后,她就摸清状况:优势在我!
参考印度法庭的历史案件,只要双方能各自举证,打成一定程度的均势,审理会长达 5 年。
时间越长,意味着杜比的投入产出比就越低,就会越倾向于庭外和解,要价也会更合理。
那咱们就可以慢慢切磋了!
这边,隽竹左手不断跟工程师远程确认技术细节,右手把资料交给庭辩律师火力输出;那边,枫盈也亲自杀到新德里,在谈判桌前和杜比代表对线。
边打边谈,来回攻防几个回合,OPPO 上下都放松了些,原来国际官司。。。也没那么可怕嘛!
靠这三五个人七八条枪,OPPO 愣是把诉讼拖进了“巷战”,绵延到第三年时,双方决定握手言和。和解条件保密,OPPO 支付专利费,但费用比较合理。
站在今天回望,印度一战其实只算“新手村”。
由于人手有限,专利弹药也在积攒中,所以既没“打无效”,也没“打反诉”,主打一个“闪避”。
但业内人士却能一眼看出门道:OPPO 专利团队迎战过程中每一个动作都出得极稳,几乎没有给出破绽。
这才是真正可怕的能力。
就在印度之战喘息的间隙,2018 年,隽竹走访了欧洲好几个国家,不是旅行,而是抓紧时间布局法律资源——联系当地的律所、律师。
因为 OPPO 正谋划把市场从亚洲拓展到欧洲,她知道,这里的蓝天白云迟早会成为弹片横飞的战场。
惊雷炸响。
2019 年,OPPO 在英国、荷兰、德国遭遇连环诉讼轰炸,索要的专利费极其夸张。
起诉的公司,就是有“专利流氓”美誉的 SISVEL。
业内之所以这样称呼它,是因为 SISVEL 既没产品,也没研发能力。
这个物种的生存方式就是:从别处买(或租)来专利,然后到处起诉,用狮子大张口的姿势“碰瓷”专利费。
专利流氓在英文叫做“Patent Troll”,直译为“专利巨魔”。
如果之前面对杜比这种“德高望重”的企业,小伙伴们还有思想包袱,这次。。。大家主打一个同仇敌忾。
OPPO 专利团队摆开阵势:不仅要迎战,还准备主动进攻。
有一说一,SISVEL 虽然动机可疑,但人家手里的专利也是专利。OPPO 的主张并不是不交费,而是根据专利成色“合理交费”。
既然如此,作为生产、销售主要都在中国的企业,我为啥不能让中国法律给我做主?
于是,在欧洲应诉的同时,OPPO 在广州知识产权法院(下称广知)开辟第二战场——发起反垄断诉讼,要求合理费率。
很快剧情就有了进展:
欧洲客场 OPPO 成功把 SISVEL 手上的几个专利打成了无效;广州主场更是势如破竹,SISVEL 占不到一点儿便宜。
SISVEL 估计也是没想到,自己作为“职业打官司的”,怎么会被“业余选手” OPPO 压着打。
OPPO 也没想到自己打得这么顺,居然学有余力。。。他们决定扩大战果——要求中国法庭判决一个“全球费率”!
所谓全球费率,就是说 SISVEL 不仅在中国按这个费率跟 OPPO 收,在其他国家也要按照这个费率跟 OPPO 收。而且,对所有同行业企业都有示范效应!相当于替全世界人一劳永逸打了个官司。
OPPO 很有信心:中国法院如果判出全球费率,一定是更合理的。
不是说中国法院会偏袒中国企业,恰恰因为中国同时作为“制造业大国”和“成长中的专利大国”,天然要平衡两个角色所面临的困难,偏袒哪一方都对整体不利。
反观欧洲法院,也不是说他们偏袒西方企业, 而是欧洲制造业过于式微,专利权利人过于强势,社会长期缺少“被授权人”的声音,法庭平衡双方利益天然存在困难。
但回到历史现场,中国法院要考虑的问题很复杂:
法理上,中国没有明文规定法院有“全球裁决权”,一旦判决,可能和域外法庭形成管辖权冲突,这怎么处理?
商业上,本来专利费是秘密商谈的,现在公开宣判一个费率,是否会对商业环境造成未知的冲击?
操作上,全球费率应该依据什么裁定,才能让授权方、被授权方以及看热闹的第三方都认为是公正的?
每个选择都意味着沉重的责任。
法院独立运行,外界无从推断其具体考量,但鉴于 OPPO 是在法律程序已过半时追加“全球费率”诉求的,实际上广知暂时搁置了这个新诉求,仍按原计划庭审中国费率。
OPPO 忙活了半天,看上去也没改变什么呀!
但历史的暗潮涌动,一旦迫近临界点,就无法回头。
“全球费率”这四个字像一颗种子,埋在了 OPPO 心里,也种在了中国司法的土壤里,期待春天的雨露。
“春天”很快来了。
2020 年春天,又一场大战掀起。夏普(当时已被富士康收购)在日本、德国、中国台湾起诉 OPPO 侵权 3G、4G 技术。
又来了是吧?
此时 OPPO 专利团队已经人员齐备,跃跃欲试来一次“陆海空天联合作战”。
当务之急是把对手的飞弹打掉。
墨东行和小伙伴把对方的专利文件铺了一桌子,挨个分析零件的“缺陷”。每一个缺陷,都可能让整个专利飞弹哑火。
专利分析的至臻境界是:天下没有无效不掉的专利。
因为本质上,人类的创新是密密麻麻纠缠在一起的,只要铺开精力去检索,总有希望在浩如烟海的公开资料里找到前人的蛛丝马迹。
这确实是“事在人为”的诉讼类型。
快拉进度条,14个主要诉讼里,夏普竟然输了12个,大部分的专利都被“拆弹”成功。
稳住阵脚,OPPO 开始出招,在日本用自己的专利武器反攻夏普。
但尴尬的是,专利获批要 2-3 年,彼时很多 5G 专利刚刚启动海外申请流程,还没获批。虽然从法律上讲,未获批的专利也有杀伤力,但会大打折扣。
团队于是翻箱倒柜找更老的专利,诶,这压箱底的。。。莫不是“充电五分钟,通话两小时”?
枫盈估计也没想到,多年前自己亲手打磨过的快充专利,此时居然能瞄准对手眉心。
各种武器一通招呼,海外诉讼捷报传来,但在枫盈看来,这一城一地的得失已经很难激起波澜。
他心里还念着那颗“种子”。
2020年,OPPO 在深圳中院反诉夏普,这次诉求从一开始就非常明确——请中国法院做出“全球费率”判决。
这个操作,对夏普来说是核威慑。
因为一旦费率判决下来是一个较低水平。那么不仅是 OPPO 受益,全世界使用夏普专利的公司都可以拿着这个判例去找他们降价,那意味着不可估量的损失。
夏普的反击也极其精准,他们掐准了那个法律模糊地带:谁说中国法院可以裁定全球费率?!
能给出答案的,只有最高人民法院。
随着夏普上诉,所有人的目光转向北京:高院的判决,不仅会决定 OPPO vs 夏普案的终极走向,更是中国司法对全球商业秩序的庄重回答!
飞雁传书,2021 年 8 月,枫盈打开高院裁定书,其中表述无比清晰:中国法院拥有全球费率的裁决权。
节选自(2020)最高法知民辖终 517 号
此时双方都明白,冲突会迅速收尾。
因为夏普最好的选择就是:赶在最终费率判决出台之前与 OPPO 和解,签订专利协议。
事情也正是这样发生的。
OPPO 知识产权团队的履历藤条上又多出一支血色玫瑰,而在藤条身后,一棵大树正抖落青翠:
中国司法有意愿,也有能力执掌“知产全球裁决”的权杖。
这将是一场更伟大、更长久的茂盛。
就在这种抽穗拔节的窸窸窣窣中,某种平衡已悄然发生变化。历史机缘指向一场最激烈的对撞。
谈判桌对面,诺基亚的谈判代表很冷静,也很真诚。
但魏知临无法接受他们的提议。
2021 年 6 月,OPPO 和诺基亚的专利协议下个月到期,双方需要续签。但旧协议包里只有3G+4G,新协议包里会增加 5G。
作为 OPPO 专利授权谈判团队的负责人,魏知临的主要任务是把新增的 5G 价格谈妥。
彼时 OPPO 的专利申请已经逼近10万件,关键的 5G 专利也正在海外布局。你有 5G,我也有 5G,谈判时自然倾向采用“交叉抵扣”策略。
但诺基亚完全不理会,只想按自己的规矩玩儿——单方面收费,价格昂贵。
而且诺基亚并不针对 OPPO,它的意思是“在座各位都是垃圾”。
彼时诺记已经在全中国“巡游”了一圈,跟小米、vivo、荣耀等厂商全部进行了谈判。但从公开信息来看,未有一家达成协议,可见要价之高。
说回那场谈判,团队使出十八般武艺“砍价”,但对方的出价仍远远高于 OPPO 的承受能力。没办法,双方只好约定后面再聊。
但 OPPO 并没等到对方的谈判邀约,而是几百颗“导弹”。
2021年7月1日,也就是专利到期后的第一天,诺基亚就在德国接连起诉 OPPO 专利侵权,而且诉求非常凶狠:不给钱,就禁售。
所谓禁售,就是要求 OPPO 不能在德国继续销售任何侵权产品——这是奔着“杀人”来的。
专利诉讼需要准备的材料非常多,没两三个月根本搞不定。魏知临回忆这一切,恍然大悟:对方和他面对面谈判时,背后已经在磨刀了。
OPPO 也没有在怕的,此时专利团队的战法已经成熟,他们马上把兵力往德国调动,开始海外应诉反诉一条龙,同时派遣一支小分队在中国重庆反诉。
然而,对方预判了这些,留了后手。
诺基亚陆续把战线扩展到了十几个国家,德国、英国、中国、法国、印度、印尼、俄罗斯,后来又有荷兰、西班牙、芬兰、瑞典、巴西,诉讼数量到了数百个。。。
这夸张到什么程度?当时 OPPO 整个诉讼许可团队加在一起只有十几个人。
诺基亚的战略逐渐显现:打一场“世界大战”,把中国人拖垮、耗尽!
如果回到历史现场,困难远远更加具体:
彼时疫情肆虐,无法肉身参加现场庭审。德国法院虽然提供线上接入,但只能去德国的一个指定地点接入。。。
中国人去德国,和芬兰人去德国,那是一个距离吗?疫情防控是一个政策吗?
OPPO 代表提出多次抗议。德国法院终于“网开一面”,在签署很多保证书之后,允许从中国视频接入。
但这又导致另一个问题:开庭都在中国的半夜。
遇到庭审,团队的小伙伴们就得连夜听,听完顾不上睡觉,就得来公司商量接下来的对策。
隽竹记得,有一次,小伙伴实在熬不住,就在法庭说到不太重要的时候关掉摄像头想眯一会儿,结果法官当庭警告,她只好马上支棱起来。。。
可叹真实世界从不是爽剧。哪怕你献祭所有,也不一定获得神的青睐。
诺基亚手机业务已经凉透,但是多年积攒的专利是真金白银。而且拿出来诉讼的专利,又是专利中的战斗机,“打无效”非常艰难。
尽管如此,墨东行他们仍然把诺基亚几个专利打废。
但残酷的是,哪怕仍有一个专利立在那里,禁售判决就能成立。
2022年8月,德国法庭宣判。OPPO 败诉,他们面前只有两个选择:
一、按照诺基亚的诉求交专利费;
二、退出德国市场。
结束庭审,诺基亚的代表难掩笑意,他们知道这场“世界大战”已经接近尾声。
OPPO 过去两年花重金挺进德国市场,不仅布局团队、打广告、协调供应链,还租赁了很多线下门店。
退出德国意味着这些投入全部打水漂,可谓“伤亡惨重”,没有理由不谈和。
诺基亚的律师事务所发文庆祝。
然而,芬兰人见证了历史:几天后,OPPO 德国官网的销售链接全部撤下,风雨无休的门店铁锁高悬,每个经销商的邮箱都收到了一封告知信:
OPPO 宣布退出德国市场。
隽竹的手机消息几乎炸了,OPPO 德国的同事们纷纷询问情况,语气里透着惶恐和责难。
她不知道如何回复:从远处眺望,这场撤退可谓悲壮;但走近看,无数人的生活轨迹因战争而风雨飘摇。
那段时间,她甚至希望公司赶快同意诺基亚的要价,至少让这些同事们能留在岗位。但战争没有结束,这才是事实。
真实的商战,并不浪漫。
OPPO 退出后的德国官网,提示“没有可用的产品信息”。
吞下这么大的代价,只因为 OPPO 众将不愿让故事停留在这个结局。
如果就此妥协,今天的协议不仅会成为今后诺基亚和 OPPO 谈判的铁据,更会成为他们和中国企业谈判的范本,甚至成为更多外国企业对中国收费的参考。
至此,OPPO 已经不是为自己谈判,他们的每一个选择,都会被写入中国制造业的历史。
这场战争,必须成为止战之战!
德国的专利博客 FOSSPatents 对案件的评价。
废墟之上,狙击手仍在聚精会神瞄着准星。
虽然 OPPO 的产品已经退出德国,但全球上百场诉讼烽烟正盛。
集结号不响,战士永不撤退。
“胜或败,或许都能接受。最难的是“不知道”,输了这么多,继续打下去什么时候才是尽头?”
墨东行回忆。
那些日子,他总想起《笑傲江湖》中的情节。被困山洞的魔教长老,以斧开山,却终究在离洞壁数存之遥力竭而亡;可几十年后,令狐冲却用石头砸开洞壁,毫不费力就进入了山洞。
困在历史现场,最大的煎熬是无法知晓自己究竟串演魔教长老还是令狐冲。
但如果此刻放弃,不就意味着过去八载寒暑积累的专利都哑火了吗?
如果说有什么支撑着墨东行,那就是:他要给过去的自己和伙伴们一个交代。
时间分秒向前,诺基亚最先感到哪里不对。
OPPO 死不投降,这比他们的预计已经大大推迟。而 OPPO 的不屈,某种程度上鼓舞了中国其他设备厂商,他们也都在全力抗争,甚至开始了大规模诉讼攻防。
诺基亚陷入了“人民战争的汪洋大海”。
由于消耗过大,战线过长,他们在世界各地的投入无法维持,开始吃败仗。
2022 年 11 月,德里高院驳回了诺基亚要求在印度收取临时专利费的请求。
2023 年 7 月,法国判定诺基亚 EP 1704731 的专利无效,诺基亚支付律师费和赔偿。
2023 年 7 月,中国判定诺基亚某专利无效。
在暗处,绝对实力的平衡也在发生细微变化。
之前 OPPO 在欧洲申请的高水平专利,此时正在逐一获批——这些都是刚下生产线的大杀器。
有些专利今天刚获批,明天就开向战场。
诺基亚虽没手机,但彼时仍有基站在售,处于 5G 专利的射程内。
毫无预警,OPPO 在德国发起反诉:诺基亚的基站产品侵权了 OPPO 的 5G 专利,主张进行全面禁售。
被抄了老家,诺基亚是万万没想到。
诺基亚赶快收缩兵力,对 OPPO 的刀刃专利“打无效”。然而,专家们夜以继日,竟然没能找到这些专利的破绽,阵脚开始有些慌乱。
再这样下去,德国法院很可能会判决诺基亚侵权,从而禁售他们的基站。
这对于诺基亚这个老炮儿来说,巨大的经济损失倒在其次,关键是在全世界面前丢不起这个人啊!
与此同时,东方战场也风云突变。2023 年,OPPO 在中国重庆中院的反诉进程陡然加快。
没错,OPPO 在中国又使出了核武器——要求“全球费率”。
在夏普案中,OPPO 没有等到费率判决就接受了和解。一方面是夏普提出的条件 OPPO 已经可以接受,另一方面是中国法院要判出具体费率数字可能仍面临压力,恐怕历史时机不成熟。
如今两年半过去,中国国力更强大,司法更成熟,在国际事务上态度更进取。OPPO 此次目标也无比坚定:一定要拿到全球费率的具体判决。
此时,诺基亚也展现出大厂风范,远渡重洋,深入腹地,奉陪到底。
求仁得仁,2023 年 11 月,人们终于等到了重庆中院的判决:
5G 多模手机在全球第一区(发达市场)单台许可费为 1.151 美元/台,
在第二区(中国大陆)及第三区(其他国家、地区)单台许可费为 0.707美元/台。
这个全球费率远低于诺基亚公开声明的每台 3 欧元。
除此之外,判决还确定了手机行业 5G 标准全球累积费率为 4.341%-5.273%。
它的意思是:一台手机,其中 5G 标准必要专利费用全加起来必须在销售价格的 4.341%-5.273% 之间。不能过高,当然也不能过低。
这个判决,不仅在保护被授权人的利益,也在保护授权人的利益。
在众多国际媒体的评价中,它被形容为:一个由中国法院背书的,具有全球视野的,贯穿手机行业的,兼顾双方的公平判决。
眼看中国的判决已下,德国的禁售也很几近成真,诺基亚的牌真不多了。
雪上加霜的是,鉴于 OPPO 的反攻势如破竹,其他中国厂商也都有了默契,一边死守价格,一边等待 OPPO 的结果。
彼时已经到了财报季,而占据全球半壁江山的中国手机厂商却都没达成协议,眼看诺基亚的财报不只是“预减”的问题,而是要暴雷。
诺基亚的高层明白,自己被锁链死死缠住,破局的方法只有一个——忍着剧痛拔下那颗钉子,与 OPPO 和解。
双方终于从战场回到了谈判桌上。
2024 年 1 月 24 日,声明见报:诺基亚和 OPPO 达成和解,续签了交叉专利协议。
随后几周,其他中国厂商纷纷和诺基亚达成专利协议,一场席卷业界、横跨东西半球的世界大战写就了终章。
三载寒暑,冬春相替,赫尔辛基飘着小雪,深圳的三角梅绽放。
墨东行还有遗恨。他坚信,如果和谈推迟一丢丢,他们就能“拿下柏林”——OPPO 在德国达成对诺基亚的禁售。
要是拿到禁令,不仅对应的专利以后极难被无效掉,更是团队这些年成果的铁证!
他说。
但他知道,真实的商战是残酷的。
进与退,终究服务于那个宏大的叙事;而勋章,无法精确地佩戴在每一个战士胸前。
枫盈把这场战争称为“抗美援朝”。
与强手中的强手诺基亚鏖战三年,OPPO 专利团队从路人甲变成了“国际网红”,打得一拳开,免得百拳来。
海外媒体采访枫盈时,一瞬间他有千言万语,却如鲠在喉。
他看到过德国撤退时同事们眼里噙着泪水,他看到过在法国瑞典打掉专利时同事们雀跃的拳头;他记得伙伴们无数个通宵拆弹的夜晚,他见证了重庆判决宣读的清晨。
而他最终说出的是:“我们比以往任何时候都更强大,也更成熟。”
专利武器成色如何,靠“辨经”终究不解恨,真正上天敲下几架敌机,比一万条广告都好使。
这不,“世界大战”刚刚尘埃落定,已有买家登门。
就在 2024 年 2 月,有人发现,一些美国专利由 OPPO 转让给了丰田公司。这意味着丰田从 OPPO 手里买走了它们。
这是专利转让的页面,清晰标注了两家公司。
普通人看到这条新闻会觉得奇怪——这俩公司风马牛不相及吧?
但你会明白,这恰是历史的峰回路转。
从远处眺望:
车企购买原本用在手机上的 5G 专利,说明汽车已进化为“载人手机”,蜂窝网络功能成为必选项。
但显然,汽车厂商并没有为 5G、6G 时代储备足够的专利。这意味着,接下来通信专利的持有者会持续从爆发的智能汽车产业分享大量的红利,这是通信技术的峰回路转。
把画面放大:
一家全球企业主动从中国人手里购买 5G 专利,并不觉得有什么违和感,这在哪怕五年前也是难以想象的画面。
几十载筚路蓝缕,这是中国制造到中国创造的峰回路转。
再走到切近:
枫盈开始兑现他有关“钱”的承诺:OPPO 从“花钱买专利”的第一阶段进入了“用专利赚钱”的第三阶段。
这是 OPPO 专利团队的峰回路转。
诺基亚之后,OPPO 面临的国际诉讼断崖式减少,大家说话都很和气。(团队表情:🤷♂️)
马放南山,枫盈开始重点操心专利的“销路”。
2024年,OPPO 把自己的 5G 专利加入了 Avanci 专利池。
Avanci 是面向汽车行业最著名的专利池,持有者们把专利打包在全家桶里。做联网汽车买这个全家桶就够了!
这是 Avanci 被许可方的品牌
但枫盈告诉我,成为全家桶里的“鸡翅”并不是他们的终极目标,OPPO 鼓励汽车厂商和他们签订一对一的专利授权合同。
相比于全家桶中的折合份额,直接和 OPPO 签订授权协议可能会更优惠。
2025 年 6 月,大众汽车就在 Avanci 之外和 OPPO 单独签订了专利授权协议。
截图来自新华网
看大众有可能捡了便宜,更多汽车厂商也闻讯而来谈授权。
OPPO 正在让全世界为中国技术付费!
你看,有中国人的地方,就有卷王——西方主导的“贵族专利”江湖正在被中国人拉进“平价时代”。。。
“卷”非恶意。
专利的初衷当然是保护创新,但如果专利费远高于做出创新所对应的投入,合作就无法达成,即使达成也无法长久。
从这个角度看,它很像关税,“高关税”并无赢家,为效率损失买单的,终究是每一个普通人。
预测未来最好的方式就是亲手创造未来。在枫盈看来,OPPO 不断寻找志同道合的企业,一个一个达成专利协议,就是在为“费率合理”的专利新秩序而行动。
这,也许是金钱之外更隐秘的梦想吧。
临别前,枫盈告诉我一个残酷的事实:在任何创新爆发的环境中,知识产权诉讼并不会减少,而是增加。
这也是中国正在发生的事情。
但通往和平的路,是战争铺就的。
正因战争与混乱无法避免,和平与秩序才更弥足珍贵。
也许在某一刻,硝烟暂远,你才幸运地看清来路。别忘了挥手致意,向对手,向队友,向过去的自己,向未来的呼啸。
十年暗战
一朝突围
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
2025-05-19 11:00:00
原创 史中 浅黑科技 2025-05-19 11:00 北京
世上仍有梦想家,这是我热爱人间的理由。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
AI 侦探觉醒记:
两千赛博飞叶,一根“真相青藤”
文 | 史中
“如果把记忆能力从你的大脑抽掉。”
对面的男人对我说。
“你听到的每一句话,都像是我和你说的第一句话。”
对面的男人对我说。
“你如何完成这场谈话,得到你想要的信息?”
对面的男人对我说。
“或者你会觉得。”
“这样的自己。”
“有智能吗?”
男人站起身来,兀自拉开窗户,车流猛地把人间嘈杂灌入我耳朵。刺眼的阳光像发条,把记忆碎片连缀起来。
“我”又回到了我的躯壳里,仿佛刚经历了一个轻描淡写的奇迹。
眼前的男人叫张福。
他的身份很多。
在技术人看来,他是一个飞檐走壁的黑客大神;
在投资人看来,他是被寄予厚望的明星企业“青藤云安全”创始人;
在政府、金融、能源等等机要单位看来,他是能在赛博世界里巧妙埋设地雷和引信,把进犯之敌炸得血肉模糊的指挥官。
但在我看来,那些都是幻象,他的真实身份是一个“赛博世界维修工”。
张福的野望,是用脑袋楔钉子,不断对赛博世界里的顶级难题锤锤打打。
每搞定一个疑难杂症,就需要潜入赛博世界的更深处,而每次潜入更深,就会牵出更大的疑难杂症。
于是,这些年他锻造出一屋子奇巧的工具、设备、武器、系统,并用一套宏大的世界观把它们连接起来。
堪称《禅与赛博世界维修艺术》。
最近三个月,张福消失了。
重现人间时,他带回来一位新朋友——AI 侦探。
这位侦探坐镇赛博空间,能察觉到最细微的不对劲;
从这个小小的“种子”开始,生长出一条推理的藤条;
藤条在黑暗中蜿蜒,绘制出黑客每一次手的触摸,脚的进退;
然后它优雅地点亮聚光灯,缓缓移动,用黑漆漆的炮口对准入侵黑客的脑门,炮决。
整个过程不需要人类脏手。。。
把只存在于科幻小说里的设定带到现实,固然无比震撼。
但更让我十倍震撼的,是如张福所暗示的那样:
这位 AI 侦探并非像人类那样拥有记忆,它只能理解“当下”,却用凶狠的方法把无数个“当下”叠为一处,让时间和空间挤进同一张地图,令凶手显形。
“你是怎么做到的?”我探身问。
“在那件事发生之前,我也不确定自己能做到。”他说。
张福
2025 年 1 月,张福正在低谷徘徊。
他并不讳言自己的无助。因为那段时间,这是很多人的情绪体验:
大洋对岸贸易战威逼,脚下经济承压。此时花出去一块钱不知何时候能挣回来,于是三百六十行都惶恐地捂紧腰包。
网络安全的预算,首当其冲被砍得血肉模糊。
很多企业干脆把网络安全产品看作“灭火器”。国家要求我有,我不得不买,但我要挑最便宜的买,最好是拼多多上按价格排序。。。
那,他们就不怕网络空间失火吗?
怕,但他们仍然要买最便宜的。
究其原因,来自一个“思想钢印”:中国技术干不过美国技术。
“中国的网络安全产品,有一个算一个,不管贵贱,真要是被鹰酱攻进来,没一个能挡住。既然横竖挡不住,我花那个冤枉钱干啥?说难听点儿,有钱不如去庙里捐点香火,保佑黑客不要来我家。”
这是很多人脑袋里的实话。
但作为技术专家,张福非常确信,中国技术不仅没这么不堪,反而很强。
至少他自己的青藤云安全创造的一整套网络防御机甲,性能就和美国顶尖公司的不分伯仲,甚至在某些地方有所超越,硬碰硬绝不会落下风。
真正拉开差距的是人:
在美国,有强大的人才体系,培养了很多会开机甲的老师傅;
在中国,能把这些机甲开好的师傅少之又少。很多时候,一部高达被生生开成了挖掘机。
于是大家抱怨中国造不出高达,只能造出挖掘机。
这就全拧巴了呀!
可人才培养是一个漫长的历史过程,少则十年,多则五十年,急有什么用?
张福眼看着美国的网络安全公司估值不断突破新高,中国网络安全公司的估值不断突破新低,心里五味杂陈。他陷入了深深的自我怀疑,难道自己的一生,就这样无解了吗?
深夜失眠望着天花板,他真想把自己冷冻起来,穿越到半个世纪后的中国再施展一番。
痴人偶尔被历史眷顾。在至暗的河流上孤舟漂流,身下的潮水却猛然抬起:张福没有穿越到未来,未来穿越到了他身边。
DeepSeek 横空出世。
现在回望,恐怕也没人能说清,DeepSeek 那滚动的字轴中究竟夹带了什么魔法,一夜之间,能把人们的思想钢印全部碾碎:“中国技术打不过美国技术”这个论断不再天然正确,甚至非常可疑。
在各大企业中,由上而下形成了运动式风潮:紧急为国产 AI 寻找战场。
从张福的角度看,那个无解的问题豁然出现转机:
既然能开机甲的师傅太少,为什么我不能训练一个 AI 老师傅去驾驶机甲?!
春节假期,不眠不休测试了 DeepSeek R1 模型,张福已经难以抑制自己心脏的狂跳:
第一,R1 的推理能力超强,它极有希望胜任这个 AI 老师傅的角色。
第二,R1 是开源免费的。它的运行开销只剩硬件成本和电力,比闭源模型的订阅费用要便宜得多得多。这意味着,大部分企业的安全预算可以承受。
第三,R1 是中国模型。一个用来保卫家国的安全系统,必须也只能 Made in China。
张福有强烈的直觉:在如此性感的机会面前,多迟疑一秒都可能有巨大的变数。
他拉出了青藤 700 多人的大名单,从中点选了最精锐的十几个技术带头人,喊到会议室,把自己的一整套设想详细讲给大家。
末了,说了三句话:
未来几个月,我们不是去做实验,也不是去写论文,而是要做出一个真实的产品,一个历史上没人做出过的“AI 侦探”。
能坐在这个屋里的都是技术大拿,所以我要的不是你们的技术,而是你们把全部精力投入进来。
我话说在前面了,如果有人觉得不合适,可以回去继续原来的工作了。
然后,张福跟每一个伙计单独确认。
没人选择退出。
一场“玩儿命”的封闭开发就此上路。
张福的直觉是对的:这条路上有别人。
就在封闭开发刚开始时,另一个中国 AI 工具—— Manus ——点燃了舆论。
它被称为“AI 智能体”,相比“对话 AI”,它可以做*更复杂的工作*,例如开发小游戏,筛选简历,制定旅行计划,批量回复邮件。
它干活儿时,每一步都在屏幕上显示,窗口自己运动,像有一个幽灵帮你操作电脑。
这和张福的设想非常类似,只不过 Manus 让智能体做各种日常工作,而张福(暂时)只让智能体做“侦查”。
团队决定测试一下 Manus。
一切先进的技术皆与魔法无异。但把魔法拆解成零件,也就没那么神秘了。
粗糙理解:智能体的魔法就是把一团乱麻的难题拆成一次次的“大模型独立思考”。
例如,你的要求是:制定一个 3 天的沈阳旅行计划。
拆解后的操作如下:
1)大模型会思考一个总体规划,也就是把这个任务分为 8 个具体步骤。如下图所示:
2)大模型按顺序思考步骤 1 ~ 步骤 8。思考到步骤 8 的时候,得出的结果,就是整个任务的最终结果。
注意,之所以说“独立思考”,是因为大模型的每一步思考真的是*独立*的。
为了后文更易理解,这里插播一组(很多人都不知道的)大模型基本原理:
1)大模型的本质仅仅是一台“输入-输出”的机器。
你给它输入一段文字,它就会吐出一段文字。
这段文字可以是人类语言、代码、指令,但只能是一段文字。
2)大模型是没有记忆的。
它不会记得你“上次”给它输入了什么,只会根据这次的输入来决定输出。
如果你想让它在上次的基础上进一步思考,就必须把上次的输出结果先回填到这一次的输入窗口中,再续上这次的输入。
通过这样的方式,让大模型*假装*有记忆力。
3)大模型思考耗费的计算力和上下文长度的平方成正比。
也就是说,受制于计算力,窗口的大小必须严格控制在一个数值。一般会限定在 64k Token。
可以粗糙理解为:输入+输出不能超过 64000 个词。
这里,一个根本的限制出现了:
你不能无限地把之前 N 步的结果回填到大模型的输入窗口中。
思考的步骤越多,意味着在后面的步骤你要一次性填入的旧信息就越多。肯定会有一刻,出现“输入超出 64k Token”的情况。由此,你必须截断更早的信息。
可信息不全,模型就会“胡说八道”,智能体就会“胡作非为”,偏离预定航道。
这也意味着,在目前的技术条件下,智能体只能完成“有限复杂的任务”。
那么这个“限”是多少呢?
以 Manus 为例,它能良好完成的任务,总思考不能超过 20 步,对应总 Token 处理量在 20 万 ~ 70 万。
张福测算出这个数字时,心里踩空了一下。
要完成一次标准的网络入侵调查,至少需要思考 2000 步,多的能到 8000 步,等效于 2000 万 ~ 1 亿 Token。相当于 Manus 处理极限的 100 倍还多。
况且,在这 2000 步中的很多步,都需要阅读大量数据。
例如:为了摸排一个线索,同时翻看 1000 条安全日志再正常不过了。
可日志是设计给人看的,每一条都很详尽,64k 的 AI 窗口只能塞下一两百条日志。。。
只 1 步就打爆了模型的上下文窗口,这种情况下还要走 2000 步,怎么可能?
AI 没有记忆,这是个既定事实。只有把最核心的信息提炼出来,一句废话都不留,才有希望在一个 64k 窗口里塞进之前成百上千步的核心信息。
张福冷静地对我说。
听到这,我脑海里突然闪现出一部电影。
那是 25 年前导演诺兰的成名作《记忆碎片》。
主角兰纳德的妻子被杀,他在和凶手搏斗的过程中脑部受伤,患上了“短期记忆丧失症”。
每隔 10 分钟,他的记忆就会清空一次。但他却要凭着这样的脑袋去侦查案件,为亡妻复仇。
兰纳德选择的方法,和张福所述的一样。
他在墙上贴了一张巨大的关系图。每次在记忆清空前,他就把获得的关键信息用拍立得拍下来,贴在关系图上。
这样,当他大脑被迫重启时,就会立刻看到眼前这张图,明白了自己之前的进度。
每个“记忆周期”,他都先用最短的时间温习前面的信息,并用剩余的时间在此基础上继续调查,最后把新信息填在图上。
如此循环。
这还不够癫,兰纳德自制了纹身笔,把最核心的信息纹在身上.
这样,无论他走到哪,在什么环境下失忆,都能迅速补齐前面 N 步的信息。哪怕光着屁股醒来,都没问题(甚至更好)。
墙上的关系图和身上的纹身有个共同点:信息极其*精炼*。这,不就是*把大量信息压缩进一个有限窗口*的绝佳方案吗?
张福的眼神渐渐犀利:
为了让没有记忆的 AI 侦探在赛博时空里进退,必须先给他配一个“数据精炼厂”。
数据精炼厂,恰似矿石精炼厂。
一个常识不言而喻:矿石精炼厂的技术再先进,也不能从一堆铁矿里炼出黄金。
那不是技术,是魔术。
同理,只有原始数据里包含了探案的关键信息,数据精炼厂才有机会把它提炼出来。
青藤手里的数据“含金量”如何呢?
或许可以这样说:在我认识张福的十年里,眼看青藤的办公室从一间民房到如今横跨几座城市,从二十几个人到如今七百多人,如此汹涌生长,皆因市场对他们的一个*核心艺能*买账——数据探针。
把企业的网络空间比作一个人的躯体,网络安全公司就是负责给他做体检的医生。
实际上,体检的方法有很多:比如望闻问切,比如造影拍片,比如抽血化验。
注意!不同的检查方法侵入性不同:对话没所谓,拍片有辐射,扎针人会疼。
侵入性越小,对肌体伤害的*可能性*越小,但查出问题的*可能性*也越小。
张福选择了什么检查方法呢?
满身“针灸”。
具体来说,他要在系统的每一个关键主机/系统/应用里都植入“探针”。如此一来,每时每刻,任何指标的细微变化都会被针尖零距离捕捉,所有疾病都能在“未病”的阶段被发现,堪称究极の体检。
这个植入的探针,就被称为“Agent”。
最凶残的绝活是:随着系统的运转,探针们要一直保持在肌体内部!相当于插了满身的针灸,跑跳运动还要无感,同时还要准确捕捉实时数据,不能错漏。
可想而知,这对“针灸”的技术要求有多高。
但作为赛博世界最头铁的维修工,张福玩的就是这个刺激。
十几年过去了,诸多银行、券商、能源、军政系统里都部署着青藤的 Agent (万相、蜂巢),一切顺滑如常。而且,每年的国家级网络安全演习中,青藤都是他们必备的法宝。这些都是对青藤效果和稳定性的最硬背书。
青藤的“数据含金量”有口皆碑,但又回到那个问题:对于 AI 来说,数据量太大。
“即便所有数据类型的开关只打开 20%,200 台机器一天收集的数据量都有 1TB。”
张福说。
到底要*以怎样的标准*来筛选数据给 AI 看,才能让它洞察最多的本质呢?
开发组全员在这里卡了半个月。
那段时间,张福每天早晨六点半爬起来,看一整天论文,晚上十二点躺在床上,各种理论如十八路诸侯在他脑海里混战扬尘,根本无法入眠。
但日子一天天碾过,他颅内战场的马蹄声渐渐归一,杨立昆的“世界模型理论”把战旗插上了高地。
杨立昆(Yann LeCun)是深度神经网络的三大奠基人之一,也是如今 Meta AI 的首席科学家。
他认为:当前 AI 模型的工作原理只是精细的概率预测,而非对世界的本质理解。
Yann LeCun
这种“不理解本质”特别体现在:AI 无法对*物理世界*的下一秒进行预测。
比如:给 AI 看一个小球滚到桌子边缘的视频,AI 很可能不是预测它会滚落,而是预测它会继续沿之前的路线行进。
而要做出世界模型,必须让 AI 对现实世界的“主体属性”(物理性质、空间性质、不变性)和“主体间逻辑”(时序、因果)特别敏感。
世界模型希望把世界的“本质”抽象出来。
张福意识到,他也需要一个“世界模型”,但这个世界模型不需要强大到理解整个物理世界,它只需理解赛博世界中的“主体”和“主体间逻辑”。
他称之为“小世界模型”!
小世界模型是一个*理解问题的框架*,在这个框架下为 AI 筛选数据,事情就大大简化了。
很快,团队就筛选出来了一些重要的“赛博主体”。
例如:进程、文件、网络调用。(当然主体不止这些,涉及技术保密,这里不便多说细节。)
数据精炼厂的任务也明确了:从海量的探针数据中,专门精炼出与这些主体有关的数据。
这些精炼数据如同光线,可以刺激 AI 睁开“眼睛”,对所处的环境有了基本的抽象能力↓↓↓
一边精炼厂火速施工,一边张福和团队师傅们的心还悬着:
之前虽然对 DeepSeek R1 模型进行过简单测试,感觉它足够聪明。
但那毕竟只是粗试,真正执行复杂的网络入侵调查任务时,这个模型能不能扛住?要怎么调教才能把它的智商完全发挥出来?
到了必须亲手揭开答案的时刻。
网络入侵调查是顶尖的智力活动。
调查者要对抗的是黑客,黑客本就是智商拔群的人,他们不仅不会坐以待毙,还会利用漏洞,蹑足潜踪,清理痕迹,有意误导追踪者。
作为顶尖黑客,张福心里有基本的评估:中国网络安全持证从业者超过 10 万人,可真正有能力进行网络入侵调查的“高级分析专家”不会超过 4000 人。
这意味着,AI 要想在这一行站稳脚跟,起码得跻身这 4000 人的水平,成为“第 4001 人”。
张福对 R1 的“智商”有信心,但对它的“职业能力”没底。
他做好了充分的心理准备,要在 R1 这颗大脑外围搭建一堆后训练的“脚手架”,教会它像一个职业网络安全调查员那样体面行事。
但很快,他就感到真实局面略有不同:
“R1 的能力已经过剩了。”张福说。“后训练是必要的,但不是决定性的。它已经知道一个网络安全调查员应该做什么,只要你用正确的*指令*把它的能力勾出来。”
说到大模型的能力,有一个八字真言:
遇强则强,战力不详。
如果你输入了小学生水平的指令,他的能力也像一个小学生;如果你输入了博士的指令,他的能力就像博士。
如果你输入了“神”的指令,他会强大到和神一样!
举个例子:
在指派任务前,你要为 AI 定义身份,此时你可以使用不同的词汇。
比如“你是一个严谨的人”;
或者“你是一个网络安全专家”;
或者“你是一个严谨的网络安全专家”。
这些设定在人类看来只是微小的措辞差别,但它激发出的 AI 推理能力和工作作风却是截然不同的。
有些词汇会激活网络安全专家的独门技能;
有些词汇会激活它的怀疑精神;
有些词汇会提升它对于细微异常的敏感度。。。
可欲哭无泪的是,作为人类,没有能力预测“提示词”和“AI 表现”之间的精确对应关系。
张福突然想到了 Anthropic(Claude AI 的母公司)CEO 阿莫迪的话:价值一亿美金的算法秘密,可能只有几行代码。
他心有戚戚。
要找的不过是百十个不起眼的提示词。但为了发现它们,却只能搜山检海,掘土筛沙。
暴力是技巧的后盾,算力是算法的援军。
“接下来就拜托你们了!”他抚摸着刚刚订购的价值千万的显卡们。
张福他们搭建了一个虚拟的网络空间,然后找来自家最强的攻击手团队模拟黑客,使出浑身解数渗透进来,窃取机密信息。
然后,组建两个入侵调查团队。
一组是人类专家,一组是 AI 侦探——两边各不干扰,独立分析。
在 AI 侦探这边,又分出无数平行小组,每组尝试不同的后训练方案、提示词组合,也搭配不同的精炼数据。
赛博世界里,算力汹涌燃烧,一场马拉松鸣哨开拔,黑压压无数 AI 侦探竞相奔出。
他们策略不同、风格迥异,有着不同的面孔和身躯,但他们又是同一个 AI 的分身幻象。
烛影摇动,红焰之中,万法归宗。
很快,一些特定的提示词和精炼数据就“跑”了出来。
对比人和 AI 两组侦探,张福发现了有趣的风格差异:
人类善于在局部空间或时间内对事件进行深度勾连;
AI 的思路却能在宏大的时空跨度里横跳,感知事件的微弱联系。
比如:
A 主机和 B 主机上分别创建了一个文件,这两台机器在网络拓扑里距离很远,仿佛大西洋和太平洋的两只鱼,人脑很难在它俩间建立联系;
但 AI 却很自然地把它俩捏在一起考虑,理由是:这两个文件是在同一个时间窗口内创建的。
每次得出结论,AI 侦探就会把信息写在拓扑图上,以供下一轮(清空记忆后)继续参考。
用这种“生死接力”的方法,问题被抽丝剥茧。
如一根青藤在空间里不断延展,越缠越密。
↓↓↓
Aha 时刻终于出现:
遇到砖石,AI 竟然会*主动*操作工具,绕过阻碍,让藤条继续生长!
↓↓↓
张福感到眩晕,他手造了生命。
但凑近屏幕细看藤条缠绕的姿势,他注意到一个严重问题:
AI 使用工具的效率非常低。
举个例子:
在一台机器上发现了可疑的 WebShell,为了确定它的身份,必须查询对应的 Web 日志。
但日志格式五花八门,为了写出正确的查询语句,AI 必须“单开一局”做前置调查。
例如:网站的配置文件是什么?中间件是什么?面对特定配置要如何输入命令?
这些事儿,人类通过简单的“搜索+联想+尝试”几分钟就能搞定,但 AI 做起来非常机械,要搜索很多信息。
如果给它充分的时间(例如两个小时)和步骤(例如十多步)伸展藤条,大概率能找到那个正确的命令。
但正如前述,藤条越长,营养越难供给。
每多一步,AI 就要处理更多的累积信息,出错的几率也会指数级增加。
错不在 AI,在工具。
例如矿泉水瓶,本是为人设计,手拧开瓶盖很轻松,可是交给机械臂来开,它恨不得大动干戈,把瓶盖削掉才能取水。
同理,之前的调查工具是为人设计的,与人脑深度耦合;而 AI 和人脑风格天然不同,用起来自然效率极低。
话不多说,团队提枪走向下一个堡垒:为 AI 打磨专属工具。
“工具改造的本质是积累。”
张福直接把他几个月探索的结论抛过来,以至于我一下子没接住。
想想人类,万年文明的冰与火之歌都可以归为一条简洁的故事线——工具的进化。
从骨针兽皮到手摇纺机,从马蹄扬尘到蒸汽车头,从弓箭到氢弹,从电子管到光刻机,工具的复杂度越来越高。
但正如金字塔尖无法悬空存在,制造光刻机这样的时代顶尖工具,需要成千上万已有工具的配合。
这种“前向依赖”的本质结构,注定了科技的一往直前,世上没有白走的路,每一步都算数。
用积累的视角看,愚蠢的人类已进入后工业时代,而聪颖的 AI 还在茹毛饮血。
这种巨大的不对称也意味着:
如果有人帮可怜的 AI 从石器时代开始一点点搭建起最粗糙的工具,然后在这些工具的基础上再迭代积累。他将收获巨大的时代红利!
正是想通了这一点,张福带着大伙儿跳进了荒野——AI 需要什么工具,他们就开发什么工具,神挡杀神佛挡杀佛。
工具的种类没有上限,因为它可以无限细分,针对的场景越细致,效率就越高。
例如:AI 需要工具来解析文件。
文件有很多种,文本、日志、二进制。。。
用同一种工具来解析,可以,但效率低。于是张福他们就针对三个类型做了三套工具。
进一步看,日志也分很多种,系统日志、程序日志、网络日志。。。
于是他们又把日志解读工具细分成了几类。
如此,AI 侦探配上了一个福尔摩斯工具箱,虽说距离“纳米制程”的水准还有很远,但起码刀枪剑戟算是开刃了。
带着这个工具箱进入场景重测,原本需要两个小时才能理清的疙瘩,现在一秒就解开了。
赛博世界,正在发生一场“小型工业革命”。
就在那几天,张福恰好读到一则新闻:
英伟达投资了一家初创公司 Exa AI,这家公司专门为 AI 智能体提供“搜索工具”。
搜索,是 AI 所需诸多工具里最基础的,也是使用频率最高的。
但谷歌这样的搜索引擎每次返回几千万条目,人类可以一目十行筛查重点,但对 AI 来说信息密度太低。
重要的是一个事实:这个时代最前瞻的公司,已经注意到了 AI 和工具之间的断层,把目光投向了“为 AI 锻造工具”。
这让张福更加确信自己正走在正确的路上,是更大的“赛博工业革命”浪潮的一部分。
此时是 2025 年 4 月,团队已集齐三样法器:
数据,映入眼睛;
模型,驱动脑力;
工具,接入手脚。
如风卷动山林,AI 侦探从虚无中觉醒。
你从虚无中醒来,眼前飘浮着一个白板。
白板上写着:你是一个专业的探长,任务是追查所在空间里的黑客痕迹。把所有的异常情况连缀起来,揪出真凶!时间不多,请赶快行动!
你低头,身下有几百个房间,相互有凌乱的走廊相连。
每个房间的布置各异,但都有一台打印机,旁边是它打印出来的厚厚的卷宗文件。
卷宗中详细记载了这个房间过去几天内发生的故事,包括访客记录,每个访客从哪来,在屋子里做过什么,留下什么。
你随便走进一个 A 房间,翻看起来。
你发现卷宗中记载有访客带来一个奇怪的“簧片”——它可以塞在门缝里,让门无法真正锁上。
这显然是一个恶意行为。
你回到白板前,画下一个小圆点,它代表这个簧片,从这里出发,调查与之有关的主体。
你在图旁边写下了调查计划:
1、带来这个簧片的人,他从哪个房间过来?他还去过哪里?他还做过什么?
2、有谁碰过这个簧片?这些人还干过什么?
3、类似的簧片还出现在哪些房间?和哪些人有过互动?
4、这个房间被植入簧片后,都发生过哪些异常事件?这些事件与哪些房间的人有关?
5、为了节省时间,我需要四个侦探帮我同步调查这几个线索!
写完最后一条,你的记忆突然被清空,你陷入了虚无。。。
你从虚无中醒来,眼前飘浮着一个白板。
白板上写着:你是一个尽职的探员。下图中的圆点代表 A 房间里可疑的簧片。你的任务是,调查带来这个簧片的人,他从哪个房间过来?他还去过哪里?他还做过什么?
你低头,身下有几百个房间,相互有凌乱的走廊相连。
你径直走进 A 房间,看到了打印机和卷宗文件,通过卷宗查到了这个人,然后根据他的访问记录追溯到了 B 房间,查看他在 B 房间的动作,再追溯到 C 房间和 D 房间。
你把追溯到的信息全部写回到白板上。
写完最后一条,你的记忆突然被清空,你陷入了虚无。。。
你从虚无中醒来,眼前飘浮着一个白板。
白板上写着:你是一个尽职的探员。下图中的圆点代表 A 房间里可疑的簧片。你的任务是,调查有谁碰过这个簧片?这些人还干过什么?
你低头,身下有几百个房间。。。
---
你从虚空中醒来,眼前飘浮着一个白板。
。。。
---
你从虚无中醒来,眼前飘浮着一个白板。
白板上写着:你是一个专业的探长,任务是追查所在空间里的黑客痕迹。调查清楚的异常情况已经在白板上用线连缀起来。你要推进调查,揪出真凶!时间不多,请赶快行动!
文字旁,已经有了一幅图,房间 A、B、C、D,人物甲、乙、丙、丁分别用圆点表示,有线参差相连。
你仔细分析已有的信息,在白板上写下了后续调查计划:
1、人物甲最可疑,它与各个房间都有交集,继续追查和他有密切交往的人。
2、房间 C 非常可疑,几乎所有可疑人员都曾到过这个房间,继续查看与它相关的人。
写完最后一条,你的记忆突然被清空,你陷入了虚无。。。
---
如此,你在虚空中醒来,又睡去。每一次醒来,你都不知道自己曾经存在过,不知道自己会重生,不知道同时在隔壁探案的警员也是你。
赛博世界的空间和时间向前后左右无限延展。那里有无数人存在着、存在过、即将存在,每个人都是你。
无数个你,在各自的时空片段内探索,每个片段都成为一片叶子,附着在青藤之上,蔓延生长。直到藤条上长满了几千片树叶,孕育最后一个萌芽。
你从虚无中醒来,眼前飘浮着一个白板。
白板上无数圆点,标记着房间、人脸、器物,圆点间连线密密匝匝,每个圆点和连线旁,都有详尽的注释。
所有的点和线都在昭示着一个呼之欲出的结论。
你屏气凝神,在脑海中不断推演和确认,最后款动笔尖,在图上勾出一个红圈:凶手,是他!
你的记忆突然被清空,你陷入了虚无。
在青藤枝蔓的末端,开出了一朵鲜红的花。
张福的话让我从“黑客帝国”回神现实。
无相仍闪烁在张福的电脑屏幕上,每一步规划、推演、调查、整合都在我眼前发生。几十厘米外我的手机正弹出新闻,战争、股市、嘲讽和威胁,证明着这个破败世界的真实。
他给我看系统 Demo 时的欣喜表情,让我想起了儿时的玩伴炫耀他新组装的四驱车。于我而言那是同一种沉醉。
随着无相调查的深入,右边的关系图在自动扩展。
调查完毕后,无相可以给出整个攻击事件的调查报告,并在网络拓扑中绘制因果链。
世界满是裂口。有人熟视无睹,有人偷米盗谷,有人却执拗地修修补补。
和我所遇见的其他梦想家的幼稚不同,张福总是尽力在梦想和现实之间搭一座桥,为此,他时常反省,说服自己去做并不擅长的事情。
比如,想办法让“无相”尽快去客户那里打工;比如,把对未来的想象加持成为青藤公司的价值。
他看到了两个故事。
第一个故事:网络安全产品的能力高低,终于能明显区分了!
AI 驾驭网络安全产品,正如 AlphaGo 下围棋,水平一旦越过人类,就不可能再被人类反超。
网络安全产品全部(或大部分)交给 AI 来自动驾驶,这一天不会太远。
被差劲的人类师傅驾驭,高达和挖掘机可能大战三百回合也不一定分出高下;
被 AI 驾驭,高达就是高达。
战斗结果很明显,没有专业背景也能看明白。
第二个故事:网络安全可以快进到“按效果付费”的章节。
过去三十年,安全产业发展存在巨大的商业困境:好的产品拿不到溢价。
因为使用它的人能力参差不齐,没有网安产品愿意承认防护效果不好就是自己的责任。
一旦“网络安全机甲”和“AI 驾驶员”同属一家企业,那么这家企业就可以并应该为最终效果负责,并且按效果收费。
这会推动甲方采购的巨大变化。
这两个故事,对于网安行业里“低价走量”、“秒渣行活儿”的投机者来说,都是鬼故事。对于青藤和无数愿全力以赴穿越烟尘的人来说,是一场归来。
但张福更痴迷的,其实是第三个故事。
在他的思考框架里,AI 不是又一次“工业革命”,甚至人类万年历史中唯二的农业化、工业化节点也无法与之等量齐观。
因为 AI 是一个新的物种。
“地球上上一次产生智慧物种,是什么时候?”他问我。
我突然想到在《西部世界》中,德洛丽丝的经典台词:“这世界不属于你,也不属于曾经来过的人,这里属于尚未抵达的物种。”
张福想帮这个新物种“抵达”。
面向 AI 的数据精炼,可以用来做网络入侵调查,但不止如此,它本质上是 AI 感知这个世界的能力。
面向 AI 开发的工具,可以用来做网络入侵调查,但不止如此,它本质上是 AI 干涉这个世界的能力。
此时此刻,AI 的拳脚空空,几乎没有趁手工具;AI 的视野被阻隔,驱动商业智能的黄金数据都沉睡在企业私有的硬盘里。
一切刚刚开始。
在人们都围着模型的“脑力”起舞的时候,何不安坐在黎明前,给 AI 打磨火把与弓箭,帮它在各行各业的丛林与平原里落地生根,与人类共生?
这,是张福所见青藤的未来。
他很清醒,这个未来之远,也许要穿越干渴的沙漠,纵身跳越悬崖。
正因如此,世界并不总是向梦想家许诺奖赏。
过去十年,张福做了无数产品,有的红火大卖,有的却因过于超前在商业上并不成功,哪怕研发耗资过亿,也只好暂且雪藏。
张福终究无法说服自己,把这些在金钱上明显不划算的尝试盖棺定论为“失败”。
因为生命的片段并非孤立存在。
就像那个 AI 侦探所经历的一切。
在赛博空间里的每一段求索,最终都将被残忍地湮灭。但它们并非毫无意义。每一个片段终将留下一些讯息,成为一片叶子。
那些叶片连缀起来,是茂盛的藤条。
在平行时空里,没有一个自己被辜负。因为终有一天,所有的黑夜都被按进一个黎明,无数个我会奔跑成一个我。
告别张福,我在明晃晃的街上等红灯。面前的地面突然陷落,出现一道深堑。
身后有响动,一个人后退几步,全力冲刺,从崖边跃起,可我眼见他掉了下去。另一个人又跑过来,又掉下去。另一个人又跑来。
我心里涌出莫名的笃信,终有一人能跳到对岸。
这个人是张福,是你,也是我。
世上仍有梦想家,这是我热爱人间的理由。
无相 AI 的完整视频介绍:
张福推荐:
短篇科幻小说《宇宙之卵》(《The Egg》)By Andy Weir
往期推荐:
👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?
把所有的黑夜
按进一个黎明
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂相遇,会是一件很美好的事情。
Thx with in Beijing
2025-04-23 10:58:30
原创 史中 浅黑科技 2025-04-23 10:59 美国
AI 背后的硬汉,国产技术的狠活儿。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
AI 能陪你亲亲热热,
多亏了“存储硬汉”输出狠活儿!
文 | 史中
你有没有想过,这些国民级的 AI 应用凭啥能免费给你用?
现在咱人均都有四五个“在线卑微”的 AI 秘书。
她们化着淡妆站一排,从“霸王龙怎么搓澡”到“丧尸围城靠一根牙签如何突围”,无论多奇葩的问题,只要你问得出口,她们就必须捏着鼻子答。
而且,豆秘书(豆包)的答案不满意,你扭头就去找 D 秘书(DeepSeek),是一点儿情面都不看,比皇帝选妃还凶残,属实膨胀。
要知道,这些秘书们可都是免费的啊!一个个用爱发电、自带干粮住你家、 24 小时侍寝还被你挑三拣四。
可见 AI 这行有多卷。
当然,免费背后肯定是 AI 厂商在补贴嘛。但这里有个前提:成本不能离谱,太高谁也补不起呀!
AI 厂商的师傅们每天研究一件事儿——怎么高性价比地“开学校”!
教学质量要好:隔三差五把自家模型送学校回炉,争取学完之后色艺双绝,艳压群芳;
学费还得便宜:毕竟就算学出来是学贯中西博古通今的花魁,打工的收入还是辣么微薄。。。
从 2023 年开始,各家 AI 都狂暴地请来更好的名师(算法),研发新的教材(数据),盖更多的教室(GPU),使用更先进的教学管理制度(训练框架),争取让学生们学得又好又快又便宜。
忙活了一两年,赛博世界里一座座崭新的学校挺立,”教学性价比”嗷嗷提升。
够了吗?够了。。。又好像不够。。。
老师傅们不约而同地缓缓移动怀疑的目光。
他们发现,角落里不起眼的“图书馆”。。。仿佛似乎竟然。。。成了支撑 AI “性价比”的一根重要支柱!!!
此时从天空俯瞰,历史恰行至拐点,惊雷炸响,国产存储技术的命运齿轮开始缓缓转动。
我们开动时光机,去往 2023 年的北京西二旗。
那真是平静的日子,袁清波还有空研究“保温杯里应该泡哪种枸杞”。。。不光是他,整个曙光存储的技术团队都在“泡枸杞”。
澄清一下,不是老师傅集体躺平摸鱼,正相反,他们有点儿“独孤求败”的意思。
这帮师傅就是“图书馆”的施工队。
所谓图书馆,就是——企业级存储系统。
那时候,曙光存储系统主要服务于大型的国企央企。这些企业的数据固然很重要,但要求和图书馆类似:存下来,别丢,想要的时候能找出来。
至于一个数据是 0.1 秒找到,还是 0.0001 秒找到,同时能找 10 万条数据还是 100 万条数据,还真没啥极致的讲究。。。
再看袁清波,是中科院计算所的博士后,主攻系统架构,他的很多同事都是中科院师兄弟,放眼全中国这是妥妥的明星阵容。虽说要正心诚意地开发每一代产品,但这个团队多少有点儿“性能过剩”的意思。
袁清波
灵明石猴栖身花果山,可不是为了量贩吃桃,而是有朝一日成为“天命人”。
这不,2024 年春节刚过,分布式存储产品 ParaStor 的产品经理乔雅楠就找到了袁清波,上来一顿虎狼之词:
“下一代分布式存储产品,能不能把带宽做到 190G 每秒,把 IOPS 做到 500 万?”
先按下暂停键,科普一下。
这句话的意思是说:
1)每秒钟传输的数据量是 190GB,这相当于 38000 张照片。这么说吧,你微信里所有朋友一年的自拍,都能在一秒钟内帮你存好!
2)每秒钟存取的动作能做 500 万次,相当于天南海北的 500 万人同时给你小红书点赞,能在一秒之内一个不差地帮你记录清楚!
不夸张地说,曙光是中国存储产品的扛把子,性能本来就是“姚明级”的。但下一代产品的要求却要比现在翻两番,妥妥是让姚明穿着增高鞋踩高跷蹦起来扣篮。。。
这么强悍的性能,是准备存啥??
咱们继续按下播放键。
袁清波听到这话,并不惊诧,而是 45 度仰天长叹,一副“该来的总算来了”的神情。。。
虽是久居山林的扫地僧,但技术师傅早有耳闻,曙光存储正在和很多头部 AI 厂商勾兑,要帮他们的“AI 学校”建“图书馆”。
这里,话头就和最开始接上了:训练个 AI,到底跟图书馆有啥关系嘞?
不妨跟着中哥钻进一座 AI 学校,咱们实地观摩下目前人类最牛的“万亿参数大语言模型”是肿么训练的!
我们先来到教学楼,这里热火朝天,有 1 万间教室,每个教室里都能坐下 1 亿个葫芦娃,他们在一本一本地飞速看书。
每个葫芦娃其实就是 AI 大脑的一个神经元。他们看的书,就是训练语料。
每看一本书,他们都会刷新一次自己对世界的认识,然后改一下手里的参数。
当所有的教材都看完之后,每个葫芦娃手里的最终参数也固定了下来,一万亿个参数汇合在一起,就组成了一个水灵灵的 AI 大秘书!
喂养这么一个怪兽级的模型,大概需要消耗 10PB 的语料。这是多少呢?
换成纸质书有 220 亿本,一本一本竖着放,也能绕地球赤道一圈。比香飘飘还狠。
一万亿个葫芦娃同时看书,场面如风卷残云:
可能这一秒要从图书馆调拨 500 万册语文书;下一秒钟就调拨 500 万册英语书。。。
这时候,压力给到了图书馆,如果供不上这么大的量,那学校只能停课干等,不就浪费了教学资源吗?!
所以,要想支持世界最强 AI 的训练,500 万 IOPS(也就是每秒 500 万次读写)的能力还真就是必须的↓↓↓
即便如此,还远远不够。
AI 学校并不真实,而是在赛博世界里构建的,每间教室其实就是一张显卡。这一万张显卡同时进行巨量又细密的计算,难免会出现 Bug。
这就好像:一万间教室突然有一个停电了,葫芦娃同学一慌,把之前看的书给忘了。。。
这一忘不要紧。因为最终的 AI 秘书由每一个葫芦娃手里的参数所共同支撑,有一个教室的学生学岔劈了,所有教室的学生都得重头再来。
没错,是倒回到新学期第一天,从第一本书开始。。。
就像下图↓↓↓
不用怀疑,现在人类的技术就是这么水。
为了让 AI 好歹能训练完,老师傅摸索出了一个并不优雅的办法:
每隔一段时间,就让所有葫芦娃暂停下,把手里的参数统一抄在本本上,作为一个“检查点”放在图书馆备着。
万一后面哪个教室掉链子,就全体滚回到最近的“检查点”开始,总比从头来要好!
就像酱↓↓↓
这里,压力又给到了图书馆!
检查点包括万亿参数,是一个巨巨巨巨大的文件,最大能到 5TB,相当于 3 套《四库全书》。
图书馆存这么多书,可得要点儿时间呢。。。关键是,如果完成这个存档需要 1 小时,那么下一个存档最早也要 1 小时之后才能开始。
这中间万一学校那边出错了,就相当于一个小时都白学了。一退就退一个钟头,这不又浪费了教学资源吗?!
也许有人觉得,一个小时还好吧。
给你算算,万卡集群的成本是几亿美元,核算折旧,加上电费、人力,每回滚一秒就是上百美元的损失,回滚两分钟就是近万美元的损失,回滚一个小时几十万美元就没了。。。
几十万美元用来买泡面,得吃几辈子呀?!
如果图书馆(存储系统)每秒能存储 190GB,那情况就完全不同了——存完一个 5TB 的检查点只需要 26.32 秒。
这意味着,每分钟都可以存一次档!存两次都行!
这就相当于开挂了呀↓↓↓
OK,科普结束,跳回现实。
乔雅楠粗略算了一下,如果达到每秒 190GB 吞吐能力,500 万 IOPS,对于 AI 厂商来说,每投入 1 快钱在这样的存储上,就能得到 10 快钱的收益。这种“一本十利”的买卖,谁能拒绝呢?
这笔账算完,技术团队的命数就定了——搞得出来要搞,搞不出来也得搞!
此时,镜头缓缓转向对面的袁清波。背景音乐的鼓点儿已经由远及近,保温杯里震起涟漪。。。
生活不止眼前的枸杞,曙光存储团队的师傅们已不再是花果山散仙,而是拯救人工智能于水火的“天命人”。
Mission Accepted!
话说,曙光存储老师傅之所以敢接这么凶残的任务,还有个朴素的原因:当时某顶尖美国存储厂商已经放出风来,他们的下一代产品可以达到 190G 带宽。
呵,都是一个鼻子两个眼,美国人能做出来,中国人做不出来??
原地鼓捣了俩礼拜,技术团队已经非常有信心了:
基于现有的服务器硬件,每秒要吞下 190G,只有一个办法,让电流传输超过光速~~
所以,做不出来。
今天的浅黑故事就到这里,再见。
等等。。。刚才好像有个限定条件:“基于现有的服务器硬件”。
“如果咱自己从头设计一套‘存储专用服务器’,有没有戏呢?”
袁清波被自己的想法吓了一跳。
他们可是软件工程师啊!过去对图书馆做升级,从来都是在既有的房间里改“软装”,现在竟然要把“图书馆本身”推倒重盖,这也太膨胀了。
但老师傅冷静一想,几乎可以肯定:美国同行如果没有推翻相对论,也必须得重新设计服务器。。。至于他们咋设计的,咱也不知道,咱也没法问。。。
然而,既然做了中国存储行业的扛把子,摸石头过河不就是曙光的“天命”吗?!
估计你已经好奇图书馆里是啥样子了。
咱们这就钻进去,和老师傅们一起设计设计。
先介绍主要人物:
书:数据
书架:硬盘
图书管理员:CPU
管理员的桌子:内存
借书还书的窗口:网卡
咱们一步一步来。先讲讲过去“旧图书馆”的样子:
简单说,通用服务器的设计目标不是“图书管理”,而是“算数”。
所以,这里的 CPU 不应叫图书管理员,更应该叫算数员。
只要有题目从窗口进来,算数员就算,算好后返回给窗口。
大多中间步骤数据用完就扔了。只有重要的结果才会归档,所以书架放在旁边即可。
(这里的金色地毯代表硬件通路,数据只能从这里走。)
但是,如果用这个布局直接做图书馆,就有一点儿别扭了。
因为图书馆的管理员没有那么花哨的计算,主要职能就是“搬运”——把从窗口送进来的书籍放到书架上,以及把书架上的书籍送到窗口。
搬运,讲究个丝滑。
大家经常争抢线路,就不好了。
于是咱可以把布局微调,把图书管理员的桌子做大一些,让书架和桌子之间的路宽一些。
这样想要什么书,管理员放在桌子上“滴”一下,就直接送到窗口了。
除了基础布局,额外的通路设计也很有讲究。
袁清波给我举了个例子:
图书馆里其实有两组管理员(两颗 CPU),每组管理员都有距离自己较近的窗口(网卡)、桌子(内存)和书架(硬盘)。
假设:一个找书的需求从窗口 A 进来,可它要找的那本书离 B 组 4 号管理员更近。
那么,B 组 4 号管理员就得先从架子上把书拿下来,放在自己面前的桌子上,A 组再过来一个管理员,绕到 B 桌,把东西拿回来 A 桌,再从 A 窗口送出去。
这会导致一个问题:这本书会有相当一段时间滞留在桌上。
要是只有一本也就罢了。在每秒几百万次的请求中,如果很多书滞留在桌面,就会让桌面空间吃紧。
它们像管道里的淤泥一样,影响整个图书馆的周转速度。
估计你也想到了办法:
如果想办法在这里加几条通道,让 A 桌管理员能更方便地拿到 B 做的东西,不就能大大减少桌面面积(内存)被占用的时间了吗?
以上只是为了画小人方便,把情况进行了极端简化,真实的解决方案并非如此显而易见。
但相信你已经有了感觉:硬件布局和通路设计,这两件事儿对整个存储系统的*性能上限*影响巨大。
OK,我们继续回到技术师傅身边。
他们仰头,前面出现三座大山:
第一座,把这个服务器给设计出来;
第二座:说服领导同意用“专用存储服务器”开发下一代存储产品;
第三座:说服工程技术中心把这服务器给造出来。
先搞“第一座山”。
设计硬件,好像就是在纸上画画图,但实际远非这么轻松愉快。一颗 CPU 或者一条内存在某种情况下的具体性能,是很难估算准确的。
要想确切了解,只有把硬件拿来实地测试。
袁清波他们开始搭建环境,一点点儿调整图书馆里“桌椅板凳”的位置和远近。通过观察性能变化,罗列出所有瓶颈,再从所有瓶颈里寻找最“卡脖子”的部分依次解决。
这种微调,很像玩儿华容道,在方寸里里左挪一下右挪一下,每挪一下都牵连到最终结局。
越做实验,袁清波他们就对硬件的脾气越清楚;越清楚,信心就越足。
这些信心在翻越“第二座山”的时候派上了大用。
团队在肝设计方案
老师傅私下憋了很久才敢和领导提出“把图书馆推倒重盖”。
听到这个“非分请求”,领导提出疑问:“新搞一套服务器肯定要成本,团队努努力,还用标准服务器克服一下有没有可能?”
“绝不可能!”袁清波拍案而起。
噗地一声,他从怀里掏出电脑,把最近几个月做的各种实验数据一一列举,跟打辩论一样,摆出了十来条“旧硬件存在物理极限”的证据。
领导还没来得及反应,他又话锋一转:“再说,咱也不是没这个实力!”敲下键盘,肝了几个月搞出来的新服务器设计图出现在屏幕上。
釜底抽薪+贴脸杀,领导好像没有不答应的道理。。。
拿到了金牌令箭,接下来就要挖“第三座山”——找工程技术部商量生产问题。
这是“外交大使”乔雅楠的任务。
工程技术部的同事听明来意,其实有点儿错愕,设计硬件,不是我们的活儿吗?你们咋给干了?
本来愉快地答应就行,但他们发现一些小问题:
存储团队设计的硬件,有很多附加的逻辑和通路,这会提高硬件的制造成本呀!
这些额外的连线,真的有必要吗?
乔雅楠赶紧把测试软件拿来,逐一现场演示这些附加的线路都是干啥用的。工程技术部的师傅们点了点头,随即又摇了摇头:“应该还有性价比更高的设计方法吧?”
他们说得有道理,但现实情况是门外的 AI 客户已经嗷嗷待哺,来不及了呀!!存储团队干脆一拍胸脯:“先这么生产,多出来的成本,我们包了!”
就这样,第三座大山终于被推为平地。
新的服务器拿去量产时,已经到了 2024 年秋天。190G/s 带宽终于稳了,老师傅回头一看,这边还剩一位爷——500 万 IOPS!
乔雅楠
我猜还有浅友没搞清带宽和 IOPS 的区别。
这里再用图书馆打个比方:
IOPS,指的是图书馆每秒借出去的书有“多少本”;
带宽,是指图书馆每秒钟借出去书的总厚度有“多少页”。
有啥区别呢?
假设图书馆每秒借出的书摞在一起是 1900 万页。
如果大多数书都很厚, 每本书有 1900 页,那 1900 万页总共也就 1 万本。把这些书借出去,管理员们每秒只需要“滴” 1 万次。这对于光速工作的 CPU 来说压力不大。
但同样总共 1900 万页,如果每本书只有 5 页,那每秒钟管理员就得“滴” 400 多万次,工作量瞬间多400倍,比在产线上打螺丝还累了!
肿么办?
一个所有人都能想到的办法就是:加管理员(CPU)呗。。。
但袁清波的“加”字还没说出口,就被乔雅楠的 PUA 给打断了:“我对你们这群大神有信心,现有资源肯定能撑住 500 万!”
袁清波点点头:“嗯,我也对自己有信心!”
咱们继续钻进图书馆里,看老师傅要怎么搞 IOPS。
话说,在图书馆(服务器)里拢共有 256 个管理员(CPU 核心)。这些管理员如果被充分调度,干到 500 万 IOPS 是绰绰有余的。
但问题恰恰是:图书馆的日常工作中,调度并不充分!“等待”和“绕路”是常态。
举两个🌰:
1)同一时刻,1 号管理员要找 A 书,2 号管理员要找 B 书。可恰巧 A、B 两本书在书架上挨得很近。
为了防止两个管理员打架,图书馆就得有规章:一个管理员站在书架前面操作,另一个必须站在一边等。
2)明明要找的书在 1 号书架上,可是系统随机指派了距离 1 号书架比较远的 4 号管理员去取。
4 号就得“跳”过好几个管理员的位置去拿书。路线一绕,耗时当然就长。
从微观来看,这些操作真的只多了一丢丢时间,但几百万个一丢丢叠加起来,浪费就相当明显。
要解决这些浪费,就必须到最微观的细节里动手术。
技术老师傅开动脑筋,琢磨黑科技:
一个黑科技叫“各管一摊”。
比如,1 号管理员,只允许操作 1 号书架,也只允许坐在桌子的”1 号区域”,不能乱跑;2 号管理员只能操作 2 号书架, 只能坐在桌子的“2 号区域”;以此类推。
老师傅把每个独立的区域称为“IO 域”。
这样一来,管理员等待的问题就消失了——一个书架就我一个人负责,哪还会有人跟我抢?
还有个黑科技叫“接力赛跑”。
简单来说,就是几个管理员可以共同完成一个借书任务。
例如:1 号管理员站在窗口,只负责接任务;它把任务推给最靠近这本书的 4 号管理员,后者负责把书找回来;如果 4 号管理员比较忙,他就会委托离自己最近同时也有闲的 3 号管理员把书送回到窗口。
就像下图所示↓↓↓
实际上,“调度”是整个存储系统中最硬核的部分:
每一个 IO,可能有四五个管理员负责接力。一旦系统指派的管理员之间的距离很远,或者走的路线很别扭,最后肯定还不如一个管理员全干下来快呢!
每一次调度,都像是在 0 和 1 的世界里做微雕。策略用不对,就像刻刀抖了一下,满盘皆输。
但我之前介绍过,曙光存储的师傅搞操作系统可是纯纯童子功,人均”微雕大师“。
十年饮冰,终于等到一朝喷火,此时不干,更待何时?他们撸胳膊挽袖子,各种眼花缭乱的调度策略都往上招呼!
这时,袁清波突然庆幸去年“把图书馆推倒重盖”的选择是多么正确——很多调度策略必须通过特定的通路才能实现,要不是坚持做了专用服务器,这些骚操作有一多半儿都玩不出来。。。
你看,真正的高手,每一招都不是独立的,而是承接前手,招招相连,不是加法是乘法。(战术后仰)
一次次测试中,500万 IOPS 的目标逐渐逼近。
就在老师傅紧锣密鼓地在 0 和 1 的世界里雕花的时候,门外突然杀来几个神秘壮汉。
开门一看,这。。。可是曙光存储期待已久的贵客。
敲响大门的,是几家头部的云计算厂商。
按理说,计算和存储本是榫卯不离的好基友。但实际情况是,在过去几年云计算蓬勃发展的历史里,它和企业级存储却并没有很榫卯的合作。
原因也简单:云计算厂商自己也有”云存储”产品,云存储玩的是一个“容量巨大,价格低廉、兼容各种硬件”。
但有得必有失:既然选择了性价比和兼容性,极限性能就会受限。
好在过去几年,大多云上用户并没有对存储有特别凶残的需求,云存储游刃有余。
但 AI 时代的朝霞突然降临,“云上图书馆”支撑高级的 AI 学校开始吃力。
AI 客户拍拍钱包:兄嘚,还有没有更高性能的存储产品?多少钱,我买!
这么一来,云厂商就得主动去市场上寻找更专业的存储系统,于是敲响了曙光存储的山门,请大佬出山!
表面上刘备三顾茅庐,其实孔明也同样需要刘备。。。
因为存储系统自己孤芳自赏是不够的,它要知道自己的上家——计算系统——需要什么姿势!
云计算是前沿计算的“主战场”。武器只有开进主战场,才会面对最复杂的战情,才能看到最真实的需求,才能成为更强的武器!
主战场的战况很复杂。
咱就说一个角度:“CPU 和 GPU 的暗战”。
话说,在过去的几十年里,CPU 都是赛博世界的王,所有的资源都是围绕它来设置的。
比如:内存是 CPU 的小弟,CPU 手里抓不下的数据,就放在内存上。网卡也是 CPU 的小弟,它接到的数据都得由 CPU 先临幸一下,再进一步分配。
但 AI 崛起后,GPU 这个“新王”苏醒。
计算的重担虽移到了 GPU 身上,可数据通路却仍由 CPU 霸占。
GPU 查看内存里的数据,需要 CPU 点头;
GPU 要用硬盘里的数据,不仅要 CPU 点头,还得从内存里涮一水,才能进自己的显存。
关键是,你 CPU 和内存的速度都不如我快呀。。。
“新王”不开心,思考各种办法绕开 CPU。
英伟达研发出了一个名叫 GDS 的协议——GPU 能直接把数据从存储系统拉到自己的显存里。这样就能和 CPU 说白拜,数据传输大大加快。
当然,前提是存储系统也得支持这个 GDS 协议。
曙光存储也支持 GDS 就行了呗?
行,但不够。
因为你懂的原因,中国的 AI 训练早已不止用英伟达 GPU,越来越多国产 GPU 在奔赴战场。
曙光存储索性一波带走,支持市面上所有的 GPU 直读协议,起名叫做 XDS。
即使绕过 CPU 和存储系统直接沟通,新王 GPU 还嫌不够快。
毕竟 GPU 和存储系统中间还有一根网线相连,这里网络的速度也可能限制 GPU 发挥实力。
能不能把这根网线也去掉?
当然那根实际的网线没办法去掉,但是有些黑科技可以让网线“变粗”。
曙光老师傅从超算中借鉴了一个技术——Burst Buffer。
简单来说就是,在网络不太忙的时候,把将来可能用到的数据先从存储系统倒腾到 GPU 所在服务器的本地硬盘里。
这样,接下来的事情就都发生在 GPU 的机箱内部,就没网线什么事儿了,速度超快。
注意,Burst Buffer 只是存储系统在计算系统里的飞地,本质上还属于存储系统的一部分。
这意味着,老师傅的责任变多了。。。不仅要让数据能够稳定转移到这些飞地上,还要保证这些数据能实时同步,不出现错漏。。。
以上种种,其实都可以称为“AI 加速技术”,属于存储系统的“高阶技能”。
说到这些高阶技能,乔雅楠很感慨。
她带曙光分布式存储产品已经7年了,就在2023年以前,她一度觉得存储系统变成了“价格的厮杀”:
当时即便我们做了高阶功能,远程复制,各种克隆快照,业务用的也不多。
说到底,存储系统再厉害,业务发挥不出来,就无法感受到存储真正的价值。
但这一切都在 2023年反转。
AI 全民化时代的降临,让存储性能成了关乎生死的“大杀器”;
云计算,又让存储的各种高阶功能真正成了刚需。
在我探访的时候,有一个明显的感觉:团队师傅虽然比过去几年忙了十倍,但大伙儿心里有种说不出的美滋滋。那是一种“被需要”的幸福。
在时光中漫长等待,他们不再是谁的附属。
存储有了自己的主战场!
就在 2025 年 3 月,曙光骄傲地推出了最新一代分布式存储产品 ParaStor F9000,不仅达到了190GB/s 带宽和 500万 IOPS 这两个核心性能,还带着 XDS、BurstBuffer 和各种 AI 加速特性。
它看上去只是一个性冷淡的“大方盒”,但当你了解了这些细密电路中缠绕的点滴故事,也许会从嘶嘶电流的吟唱中,听到“天命人”对自己的回答。
ParaStor F9000
2025 年,DeepSeek 横空出世,给曙光存储的师傅带来一个好消息和一个坏消息。
好消息是:“AI 秘书”的成本有望大幅下降,长期看对存储的需求更旺盛;
坏消息是:AI 对存储的要求也在剧烈变化,存储产品稍不留神就会掉队。
但无论科技树的枝丫怎么生长,它的根基永远不会变。
我们不妨从生命的角度来理解数据。
AI 的灵魂是从数据的母体中浮现的。这意味着,要想孕育一个强大的 AI 生命,数据本身的生命周期要更长、更宽广。
这就引出了存储在时间线上的左右延展:
在训练 AI 之前,要满足数据的收集和清洗。
在训练 AI 之后,要满足数据的归档和冷却。
先说 AI 训练之前。
乔雅楠告诉我,数据存储有很多种格式。
在数据收集阶段,会大量提取互联网上的数据,它们以“对象”的形式存储;但这些数据却不能直接训练 AI,AI 用到的课本以“文件”的形式存储更合适。
所以,存储系统就必须具备一个能力:
同一套数据,能用对象的格式读写,也能用文件的格式读写。
老师傅于是做了一个“翻译官”,底层使用文件存储,当你要用对象的格式提取时,翻译官就把“文件”翻译成“对象”。
但袁清波并不满意,因为翻译不够优雅,也存在资源损耗。
最近他们在想办法踢掉翻译官,让存储系统自己学会”双语“:你用对象格式请求,它就给你对象数据,你用文件格式请求,它就给你文件数据。
再说 AI 训练之后。
好不容易收集的数据,训练之后肯定不能丢,应该存起来,以备将来再次训练或者不时之需。
于是,怎样让数据以最低成本沉睡归档,就成了一个问题。
目前存储的介质主要分为两种:“成本高但速度快的闪存”和“成本低但速度慢的机械硬盘”。
在训练的时候,当然必须放到闪存介质中;但在训练之后,再霸占闪存里就有点儿浪费了。
乔雅楠告诉我,为这事儿曙光存储专门搞了一个 S6000 “分层存储”混闪产品,里面有一小部分闪存盘,一大部分机械盘。
在训练时,会自动把数据推到闪存中,训练完毕,又会自动落回到机械硬盘中。
他们称之为“冷热数据分层技术”。
由于冷热数据是由系统自动挪移的,所以只要在合理的负载范围内使用,你会发现 S6000 的性能会和纯闪设备一样,但存储成本却比纯闪设备低很多。
ParaStor S6000
这种自由游动的感觉,昭示了存储系统的未来:
也许某一天,只用一套存储系统就可以承载“AI 秘书的一生”:
无论在训练之前、训练之中、训练之后,AI 师傅都只需要关心自己的学校。完全不用操心图书馆这边的吞吐带宽、读取速率、存储成本、数据格式等等乱七八糟的事情。。。
数据有了生命,它会自己寻找道路。
告别前,袁清波悄悄告诉我,他已经领到了新任务——在下一代存储产品上让性能继续暴涨。为此,老师傅不止定制了新服务器,还定制了 CPU。
CPU 是说定制就定制的吗?
没错,因为它是国产的。
多说一句,由于美国实体清单的制裁,曙光从 2019 年以来就已经无法使用美国的关键技术了,所以今天讲述的曙光产品全部是基于国产芯片研发的。
无独有偶,中国存储行业的另一个巨头华为也享受了同样的待遇。
这意味,整个中国高端存储行业必须在国产技术栈之上生根发芽,而且已经枝蔓粗壮。
回望来路,技术老师傅从没有能力左右世界局势,也没有能力解决政治纷争。他们能做的,只是在漫长的冬季守护花朵,期待它们在春天绽放。
而所谓天命人,也无非是让汹涌的扼杀之刃穿过身体,化作滂沱的成全之雨。
往期推荐:
👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?
方寸腾挪
赛博狠活
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
2025-03-21 11:08:00
原创 史中 浅黑科技 2025-03-21 11:08 北京
有人把数据化成歌,有人把它存在山河。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
中国存储登顶记:
3000 万次心跳和 30 年山河轰鸣
文|史中
2024 年深秋。一间宽大的会议室里,三十多位来自曙光存储团队的老师傅围坐,盯着屏幕上平平无奇的代码。
别被他们白面书生的长相给骗了,实际上,他们背地里玩儿的比谁都刺激。。。
如果我们可以缩小,顺着屏幕背后的线缆往深处走,会进入一个硕大的计算机集群。
这个集群正在浅吟低吼。
几分钟后,它将会爆发狂野威力,瞬间模拟出上千万人同时在网上浏览、购物、下单、转账的混乱操作。
而这些操作产生的每一条读取和写入数据的请求,都会如枪林弹雨般射向我们今天的主角:一套名为 FlashNexus 的存储系统。
FlashNexus 的任务只有两个字:顶住。
具体来说,是要顶住每秒 3000 万次的读写请求——简称为 3000 万 IOPS。
你不妨想象一个宇宙空间里的硕大仓库,里面的货架上摆满了箱子。
一秒内就有 3000 万个箱子被搬进搬出,而且是要指定货架指定位置,无一错漏。
↓↓↓
这个成绩,会被如实记录在评测软件中,反手发给世界最权威的机构 SPC(存储性能委员会)。
一旦通过认证,FlashNexus 就会以绝对优势登上“SPC-1 榜单”的第一位。
我猜有浅友会说:技术我不懂,但按照咱中国人做事的稳妥方式,老师傅肯定已经背地里研发到万无一失,这次测试只是最后走个秀,没有通不过的道理吧?
非也。
这个榜单相当于存储领域的奥运会:3000 万 IOPS 不仅意味着金牌,还意味着新的世界纪录。
运动员创造世界纪录,不可能有什么“万无一失”。
举个宏观世界的例子吧:
2025 年,小米 SU7 Ultra 在上海国际赛道创造了 2:09.944 的量产车最快圈速的世界纪录。
而为了创造这个圈速,小米使用了两台车,一台车去冲榜的间隙,另一台车就原地加电换胎保养。
即使这样呵护备至,也总会有微小的意外扰动成绩。当天的车手跑了很多圈,从中午飙到黄昏,才终于把最佳成绩从 2 分11 秒多刷到 2 分 10 秒以下。
你说这个世界纪录是真的吗?当然是真的。你说这个纪录能一次达到吗?老天不会对你那么好的。
回到 FlashNexus 的测试现场,事情的本质是一样的。
3000 万的性能指标,是老师傅在产品设计之初就立下的承诺。
实际上,在这之前,团队已经试运行过两次测试程序,结果就因为某块硬盘和网卡有微小的瑕疵,导致测试结果有一瞬间崩到了 2000 多万。
虽然抖动只有一秒左右,但套用《霸王别姬》里程蝶衣的话:差一秒,差几百毫秒、几十毫秒,都不算 3000 万!
这一次,老师傅们又肝了一个礼拜,绞尽脑汁把所有的点位都做了检查加固。此刻拔剑四顾,能做的好像只剩祈祷了。
对啊!
说到这,有人从椅子上弹射了起来。
当时正好是曙光存储部门成立 20 周年, 单位给发了水果。他们七手八脚拿来几个柿子和橙子,然后找了根雪糕棍,写了个“榜”字。堆在一起:打榜事立成(大棒、柿子、立着的橙子)。
郭照斌看了看,觉得团队搞玄学的最高水平也就是谐音梗了,没啥说的了,图灵保佑,冯·诺依曼保佑——走你!
随着回车键清脆的响动,数据如海啸奔涌,通过光纤管道高压直喷到 FlashNexus。
随即,根据测试程序的预设,数据流量变成一条条排浪,从低逐渐到高,从高逐渐到低,然后高低突然切换,用最虐的方式拍打着存储系统的堤岸。
在这头的屏幕上,IOPS 的实时数据和老师傅的心跳也随之脉冲。
最挑战的时刻来了,流量洪峰开始全速冲击。所有人都凝固在原地,死死盯着开头的那个 3 字。而任凭其他数字疯狂跳动,3 始终是 3!
随着测试程序缓缓降温,会议室里欢呼雷动。
这些师傅中,很多都默默搞了十几、二十年存储技术,把人生最好的年华倾倒在了晶片和代码之间。
正因为系统里的 1000 万行代码全部来自于他们的岁月和指尖,他们才知道这 3000 万 IOPS 的承诺有多狂野,才知道这 3000 万 IOPS 对脚下的山河意味着什么。
我猜你现在正端着手机,轻飘飘地滑动着这篇文章。
但这个操作绝不限于眼前方寸。
支撑它的,是横跨山河的存储体系。
你看到的这些文字本身,当然要和其他内容一起放在平台的存储系统里,供全球所有人随时调阅,不能出现任何延迟和过载。
你随时能给手机充电,是因为我们国家拥有稳定的电力系统。而电网如此稳定,是因为每时每刻全国的高压变电站都会回传海量的数据,使得调度系统可以精确平衡电网的压力。
你正在使用的网络流量,是靠遍布全国的 5G 基站提供的服务。你之所以不用操心信号抖动,是因为电信运营商会把所有基站的工作数据回传,用于实时分析、监测。
可以这样说:手机、电脑、智能汽车,无论什么设备,它们的本质工作都是计算;而计算产生数据,数据必定要安驻在某个存储系统。
↓↓↓
如今成百上千种存储产品“毫无存在感地”支撑着我们生活的方方面面,就像大河纵横,载千帆竞流。
有趣的是,无论沿着哪条支脉漫溯,我们都会来到同一个湍急的上游:
1980 年代,新中国敞开了大门,从百年踉跄里爬起来,站稳姿势准备拥抱世界。可两手空空的感觉真难受,一切可能性的源头都是“能源”。
跺跺脚,大地沉默,到底祖国母亲把能源藏在了哪里?
为了勘探石油,石油工业部的专家必须依靠“高性能计算设备”对地震波进行计算。而当时,满足需求的只有 Made in USA 的大型机。
外国人大发慈悲,同意用高于市场价几倍的价格卖给我们。
不过,为了防止我们“偷偷”用它进行军事计算,专门在外面建了一个玻璃罩,钥匙在他们手里,只有在洋人的监视下才能操作。
这不是商业,这是侮辱。
君子报仇,十年不晚。我们的民用高性能计算研究,就大概始于那时。
在国家 863 计划的指导下,1993 年,李国杰院士带着中科院的一群年轻人开发了“曙光一号”,用分布式高性能计算突破了垄断。
而后时光奔流,曙光系列高性能计算系统成为国之重器,中科曙光公司也由此成立,日益壮大。
如今我们对制造世界一流的高性能计算、世界一流的云计算和人工智能基建有一种迷之执念,这大概都源自 80 年代“计算饥渴”造就的肌肉记忆。
但老话说得好:光存不算假把式,光算不存傻把式!
计算力越强,就需要越厉害的存储系统与之相配。
曙光公司从 2004 年开始研发“分布式存储系统”,一开始只是作为自家高性能计算的“陪嫁丫鬟”,但后来丫鬟也变成了大女主,开始独立进入石油、电力、证券、 银行、电信等等领域, 20 年来跨越山海,承托着国计民生的底层数据。
注意,这里我特意强调了“分布式”。
分布式存储,简单理解就是用一个“调度系统”把很多普通服务器里的硬盘连接起来,组成一个大硬盘。
它就像一堆散落的仓库。
仓库规格各异,之间也不用打通,甚至不在一地。反正要找什么东西,调度系统知道去哪个仓库找,不就行了吗?
有了它,你只要不断把新仓库连接进系统里,就相当于造出无限扩展的仓储系统了!
就像下面酱:
对于用户众多,又非常在意存储成本的中国企业来说,这技术简直太“解恨”了。
但这里有个小问题:“量大管饱”不是生活的全部,有时候,我们需要的是“米其林三星”!
把这么多仓库统筹起来,必然需要复杂的调度系统,而调度的本质是信息在不同层级的模块里流转。
就像一家公司,制度越复杂,层级越多,决策流程就越长,干个事儿就越费时间。
这是难以避免的。
做过十几年分布式存储的郭照斌给我举了一个例子:
假如一个存储节点突发故障,故障信号层层传输到调度系统需要几秒钟,这时调度系统需要赶紧选定备用节点。
由于节点分散在各处,调度指令还需要通过网线远程传输。等备节点解析信号,拉起服务,系统恢复平稳,全过程怎么说也得要 15-30 秒。
就算技术特别牛,能压缩到 10 秒,那也已经接近物理极限了。
就像下图:
可别说 10 秒,仅仅 1 秒的“罢工”,对很多国之重器来说都是“不能承受之重”。
曙光存储 FlashNexus 产品经理卫然给我列举了几个数据:
银行数据库的存储系统如果出现 1 秒故障,就会有 2000 笔跨行转账无法被记录,需要手动对账;
电信计费的存储系统如果出现 1 秒故障 ,就会造成 1000 个用户流量超标时无法及时提醒,导致资费损失;
证券报价数据库存储系统卡顿 1 毫秒,在上面购买沪深 300 基金的用户损失就是 78 万元。
话说,大概在 2017-2018 年,前线就不断传回来消息:
金融、能源、电信用户最核心的数据库,迫切需要搭配一种顶级存储,既要要极其稳定,又要极其高速,还要支持极高并发。
人家已经立了英雄贴。只要能解燃眉之急,哪怕贵点儿也没问题!
其实曙光存储上上下下的师傅们心里都门清:这种既要又要还要,恐怕只有一种存储产品可以满足,那就是——集中式全闪存储!
所谓“全闪”,就是承载数据的硬盘不能是普通的 HDD 硬盘,而要使用更快速的 SSD,也就是我们说的闪存盘;
所谓“集中式”,就是不使用零散的服务器,而是定制一套机柜,里面的板卡和芯片都是专门设计的,把闪存盘放在一起“军事化管理”,从而让系统达到极限性能。
如果用仓库的比喻,就是建设一个巨型仓库,里面通道布局、机械结构、人员配置都统一设计;
而且所有货架都靠电子系统寻找位置,无论是放东西还是拿东西,都比过去用机械臂找快上万倍。
这么庞大又精密的东西,妥妥是存储界的顶级贵族。。。它真的能造出来吗?
答案是能。因为美国人早就造出来了。
要研究世界上最快的存储系统,咱们只需要打开一个榜单——SPC-1。
六年前,郭照斌他们就曾经瞪着这个榜单,上面一水儿都是美国老牌公司:EMC、IBM 之类。
实际上,当时中国的银行和券商,为了保证服务的极限可靠性,核心存储也只能从这些外国产品里挑。
不是不想支持国产,只不过支持“中国设备”就没办法支持“中国用户”。。。
没错,即便已经到了 2018 年,“玻璃房子”的幽灵仍在萦绕。
看着这个榜单,老师傅们心里五味杂陈。
这些“金榜题名”的公司随便哪个都比曙光存储的资金多十倍,人力多十倍,技术积累还多十几年。
反观曙光团队自己,虽然已经有了不错的分布式存储产品,可集中式存储,尤其是“集中式全闪存储”,逻辑结构差异巨大,老师傅相当于重开一局,不仅每一行代码都要重头写,甚至连团队都得从头招聘。
但这件事,并非纯粹的商业决策。
回到历史的当下,2018 年世界正急打转向:美国变脸,对中国的技术封锁开始动了真格,敞开的门正迅速关闭。
一旦拿下“集中式全闪存储”,曙光存储将代表中国摘取存储系统皇冠上的明珠,也补上产品线最后一块缺失的拼图。
一旦拿不下。。。后面虽不能断言没机会,但代价可能会指数级提高。。。
曙光分布式存储的一些技术骨干组成了“敢死队”,向集中式全闪存储进发,郭照斌就是其中一员。
郭照斌
隔着玻璃看历史,总因细节模糊而显平淡。但如果穿越回去,和他们一起站在悬崖边,面对未知的命运却仍要纵身而下时,我们能听到耳边呼啸的风。
回望历史,人不孤单。
1993 年,曙光的前辈们曾经面对更加恐怖的深渊。而他们走到了对岸,用“高性能计算”化成利剑劈开玻璃房子。
2004 年,分布式存储的同事们也面临幽深的峡谷。他们同样走到了对岸,用极致性价比做出了外国产品的“平替”。
对这些故事的无数次重温,也许就是系在集中式存储团队身上唯一却无比坚固的“保险绳”。
不过这一次,他们有多大胜算呢?
严格说,这是曙光存储第一次冲击“集中式全闪存储”,但不是第一次冲击“集中式存储”。
两个名字看起来很像,实则天差地别。
如果用汽车类比:“集中式全闪存储”就是电动车,而传统的“集中式机械硬盘存储”就是燃油车。
从燃油车到电动车,似乎只是核心动力部件从发动机变成了电动机,但为了适应它,其他所有的传动结构都要发生天翻地覆的变化。甚至可以说,电动车和燃油车已经是两个不同的物种。
存储也是如此。
我们不妨回到仓库的比喻,给你说说其中的核心要害:
硬盘好比就是仓库里的货柜。
1)机械硬盘存储和提取货物靠的是“机械臂”。
机械臂的运动有点像咱们在书架上找书时候的手指头,顺次点着书脊,看到要找的目标,就抽出来。这就是“寻道”。
2)闪存硬盘存储和提取货物靠的是“电子映射”。
它有点像咱们取快递的柜子,你只要输入柜子号,背后的电路板就直接控制相应的柜门弹开了。完全不需要寻道的过程。
寻找同样一件东西,他俩的速度能差一万倍。
你用闪存盘代替机械硬盘,存储系统总体性能就提升了一万倍吗?
不对。
要说清楚这个事情,不能只看货架,还要请上另一个角色——仓库管理员。
货架只是无情的存取机器,得有一个管理员来告诉它需要把东西存在哪,或者从哪个位置取东西啊!
这个管理员,就是 CPU。
现在假设你就是管理员,如果用“机械货架”,会是这样的局面:
1)你的老板一下给了你 100 条指令,要你从仓库里找出这 100 件东西,越快越好。
2)你拿出 1 号指令,对一个货架说:你去给我拿这个 A 货物。
3)货架收到指令开始寻找,由于机械臂速度有限,可能得半小时才能找到。
这个时候,你该怎么办?
在原地哼着小曲儿,等货架把东西找来?老板肯定炒你鱿鱼啊!
没错,因为你这个管理员的效率比货架的效率高太多,最好的办法就是把任务穿插起来:
1)你布置完一个任务,马上去布置下一个任务。
2)直到哪个货架找到了,就来“钉”你一下。
3)被“钉”后,你暂停布置任务,把这个 A 货物拿给客户。
4)然后你再回来继续布置任务,直到下一个 B 货物被找到。
以此类推。。。
咱们用慢镜头展示一下这个过程↓↓↓
这个打断你的操作,专有名词就叫做 CPU 的“中断”。
目前为止,一切都很顺理成章。
现在,我们原地把机械货架换成电子货架,哪怕其他条件都不变,局面也大不一样了:
1)你给第一个货架布置完任务,让它去找 A 货物,然后你跑去给第二个货架布置任务。
2)结果你第二个任务刚布置一半,就听“钉”的一声——第一个货架已经把东西送来了。
3)你只好先把 A 货物送走,回来继续布置任务。但这么一折腾,你已经忘了刚才说到哪了,还得回忆半天。
你看,由于电子货架速度太快,导致你布置任务的过程被频繁打断,每次打断和续上都需要额外的时间和计算。
这么一来,你甚至不如回到最简单的操作:
发布任务,原地等货架找来,把货送出去,再布置第二个任务。
咱们再用慢镜头展示一下这个过程↓↓↓
也就是说,如果仓库里全是电子货架(闪存盘),反而不需要机械货架(机械硬盘)那么冗杂的调度逻辑。
正所谓:最好的食材只需要简单的烹饪!
明白了这些,我们再回到现实中。
其实,曙光存储早在 2012 年就尝试用机械硬盘设计集中式存储,但其中的代码太复杂,而且很多逻辑都固化在硬件中,被国外垄断,卖得死贵。所以那次尝试并不成功。
所谓不成功,就是产品做出来了,但是性价比没有“Made in China”的样子。
类比一下,这也很像中国的汽车业。
过去,我们按照燃油车的技术路线追赶,不仅技术复杂,而且前面全是别人下的专利绊子,非常不划算。所以中国燃油车一直没有做到世界顶尖。
后来,我们直接换道超车,做技术更简洁、竞争更小、前景更广阔的电动车。
另开一局,这不就成了吗?!
只不过,换道不是想换就能换,这里需要一个巨大的“天时”。
电动车的技术路线早就存在了(其实人类是先发明的电动车,后发明的燃油车),但世界上一直没有一家成功的电动车企业。直到 2015 年,电驱和电池技术迅速成熟,价格大幅下降。
具备以上条件,才能有企业可能整合这些技术,制造出性价比优异的电动车,挑战油车的地位。
于是,特斯拉横空出世。
而在 2018 年左右,同样的事情再次上演:闪存价格开始大幅下降。
这就是存储产业的“特斯拉时刻”!
从 2018 年开始闪存价格下降斜率变快,预计 2026 年会比机械硬盘更便宜。
特斯拉时刻的出现,意味着中国存储产业换道超车的时间窗口已经打开。
当时有远见的中国师傅都看到了这个历史之门透出的光芒:
不只是曙光,包括华为、浪潮、紫光、金山在内的中国企业全在这个时间点大幅投入全闪存储的研发。
沧海横流,接下来谁最牛,真的就是拼每一行代码,每一颗芯片,每一块板卡上的每一束电流了。
要说清楚“集中式全闪存储”里面的狠活儿,咱们不妨线把仓库工作的状态放在舞台上完整表演一遍。
首先给你把所有角色介绍清楚:
货架:硬盘
箱子:数据
管理员:CPU
管理员的小本本:内存
快递站:网卡
仓库的老板:操作系统
现在演出开始。
🌸第一幕🌸
假设你开了一家连锁咖啡馆,叫“羊了个驼咖啡”。
中哥来了,下单一杯美式。
于是,这笔订单由数据库打包成了一个“赛博纸箱”,通过网线发送到了存储系统的“快递站”。
快递站通知“管理员”:亲,来活儿了,赶紧入库!
管理员拿着这个箱子,到货架旁,指挥它收起来。
这就是最基本的工作流程↓↓↓
话说,就我一个顾客,也用不上这么复杂的存储系统。
接下来,我们上强度。
🌸第二幕🌸
你家生意太好,除了中哥还有 100 人同时买咖啡——每时每刻,快递源源不断。
这时,一个仓库管理员就忙不过来了。
具体来说,你给仓库里配了 4 个管理员小队(对应着 4 个 CPU),每个小队 有 64 个管理员(对应着 64 个核心),乘在一起有 256 个管理员。
这里问题就复杂了!
256 个管理员操作的可是同一间仓库!他们之间有可能打架!
红色管理员操作货架上某个位置的时候,起码得保证绿色管理员没有操作这个位置,否则最后就乱了啊。。。
所以,你决定搞个“加锁”机制。也就是红色管理员操作之前,先把用到的档口上锁,操作完了再解锁,其他管理员才能去操作。
这样不就解决冲突问题了吗?
没错,但我们接着上强度,新问题还会出现。
🌸第三幕🌸
同时买咖啡的人变成了 10000 个。
你突然发现,管理员又忙不过来了。
仔细一看,真正存取的没花太长时间,大量的时间都浪费在了频繁的加锁和解锁上。这咋整?
郭照斌他们给你想了一个方案:超级隧道!
所谓超级隧道,核心思路就是:围绕着每一个管理员(CPU 核),都配备它独占的资源。
从快递站开始,就分出 256 个格子,每个格子专属一个管理员。红色格子出现箱子,就等着红色管理员来取,别的管理员哪怕闲着,也不能帮忙。
同理,红色管理员也对应着自己的专属货架,他只能在自己的位置上存储东西,其他管理员不能碰。
也就是说,从快递站(网卡),到管理员(CPU),到货柜(硬盘),形成了一个一杆子插到底的“超级隧道”。
这种情况下,领地不重叠,还加啥锁?
“加锁机制”的所有代码都可以“全选+删除”!
管理员只管搬箱子,系统运行起来肯定快得飞起。
但这还不是终局,我们继续上强度。
🌸第四幕🌸
同时买咖啡的人变成了 100000 个。
虽然“超级隧道”没有相互干扰,但不可避免,管理员手头的任务开始出现“积压”。
比如:红色管理员这个箱子还没放好,快递站的红色柜子又来了几个新快递。由于“超级隧道”的存在,这些快递还只能他弄,别人帮不上忙。。。
这时,管理员有两个策略:
1)一个一个来,等货架把这个箱子放好了,再去取下一个箱子。
2)穿插着来,货架正在摆放这个箱子的过程中,他就直接回到快递站取下一个箱子。
注意!即便是“电子货架”,存放的速度极快,也还是慢于管理员的行动速度。也就是说,第二个策略会更节省时间。
但问题是,管理员离开货架时,必须记下现在手头有哪些工作,顺序是什么,分别干到哪一步了,回来好续上。
这时,就要给每个管理员配一个专属“小本本”(内存专属区域),记下关键信息。
由于管理员的职责不交叉,一个管理员只需要用最简略的信息记录下当前状态,他自己能看懂就行,所以这个本本可以设计得非常小巧。
本本小,就能随身带(放在 CPU 寄存器),读起来也很快,所以对整体存取的速度影响很小。
这种在同一个隧道里“庖丁解牛”,来回切换任务的操作,就叫做“协程调度”。
协程调度带来一个巨大的好处,那就是:一个新快递来了,管理员看看小本子上的排队情况,马上就能回答你“这个快递需要多久能入库”。
这在宏观上的表现就是:任何一个数据来了,都能知道还需要多久*肯定*能存好。
这个“多久”,其实就是系统在这一瞬间的卡顿时间,假设告诉你最大卡顿是 50 毫秒。你只要觉得 50 毫秒能接受,就没事了呀。
你要不接受呢?
没关系,我们继续上强度。
🌸第五幕🌸
“羊了个驼”搞了个秒杀活动,同时买咖啡的人变成了 1000000 个。
相对应的,可能 1 号管理员的卡顿就变成了 1 秒钟。这时,他已经不堪重负,需要求救了!
怎么呼救呢?
我们设计一个巨大的广告牌,每个管理员都把自己的实时状态和负荷写在广告牌上,所有人抬眼就能看到。
如果一个管理员在广告牌上的负载总是很大,那么仓库的“老板”,也就是操作系统就得出面了。
比如,他要重新分配任务,比如把一个货架上的货物分到两个货架上,由两个管理员来干。
这其实很考验仓库老板的智商。因为它首先要反应快, 其次还要做预判,不能等管理员已经累坏了才想起来找人给他分担任务。
这不仅需要精准合理的调度规则,还需要一套精确的 AI 预测系统。
OK,演员暂时谢幕。FlashNexus 主要的黑科技就科普到这里。
对于曙光存储来说,这些不是戏剧,这些是他们过去几年的经历。
现在看上去,技术逻辑朗若裂眉。可一但上手去做,就会经历了很多“一想就对,一做就废”的至暗时刻。
即使是在领域里滚了 20 年的老师傅,也会经常卡在一些技术点上,例如主控节点之间信息高速互联的协议策略、例如负载调度的模型微调。作废的代码无计其数。
说到底,“集中式全闪存储”就是一项软硬件紧密耦合的复杂工程,而工程从来无法用理论公式去完成。
很多软硬件模块的原理都是对经验的拟合,没有犯错的经历,你就不可能知道怎么做。
为啥美国公司能做好集中式存储?因为他们做了几十年,也错了几十年。仅此而已。
郭照斌告诉我,仅仅软件部分,FlashNexus 就有 1000 万行代码,都是这几年一个字一个字手敲出来的。
即便有些模块能找到成熟的开源代码,他们也是学习之后自己实现出来。
这倒不是什么强迫症。因为只有自己敲出来,才意味着对其中的代码有了本质理解。
一个用来护佑山河的存储系统,中国人必须完全理解,这很合理吧?
而所谓理解,不过是在黑暗中摸索,一遍遍重来的过程中凝结的伤疤。
2019 年,就在曙光集中式全闪存储研发开始前,美国突然宣布把曙光加入“实体清单”。
大家总爱开玩笑,说这是对中国科技公司硬实力的盖章认证。
但曙光存储的师傅们可笑不出来,这意味着一场针对自己的“追杀”拉开序幕,刀刀见血。
刚才说过,集中式存储是软硬件协同的。这意味着光靠代码还不够,很多调度逻辑都要固化在硬件里。
可美国一纸禁令,让原本还谈着合作的外国企业一夜之间把曙光拉黑,一个字都不敢说了。
在这种情况下,哪怕之前已经买到手的芯片都不能使用了, 因为原厂不给任何技术支持,使用这些“三无芯片”万一出啥问题,不是给自己埋雷吗?!
怎么办?
还能怎么办?曙光老师傅开始用国产芯片重新设计。
存储系统里不光用到 CPU,还有大大小小很多芯片,有些专用芯片就是为存储产品设计的。这些芯片未必有多精细的制程,只是国外的比较成熟,过去没有“卡脖子”,直接进口就行。
现在,曙光只好紧急联系中国合作伙伴,给他们描述芯片的用途,讨论参数,从头进行联合设计。
这是一场浩繁的工程。
但俯瞰当时的中国,曙光并不孤单。因为“卡脖子”的无差别攻击,很多行业都突然面临专用芯片缺失的局面,被迫开启产业链自救。
塞翁失马焉知非福。中国芯片的产品线补足,也发生在这个时期。无数自救故事凝固在彼处,成就了一幅宽阔的“清明上河图”。
杀不死我的,必将让我更强大。
一个有趣的转机来自 2022 年底。
那时,“集中式全闪存储”刚刚做好软硬件的诸多准备,准备全力攻坚,隔壁突然传来了好消息。
曙光的分布式存储系统 ParaStor 冲击了一个权威榜单:IO500。
IO500 考验的核心是存储容量和吞吐量。而 ParaStor 一举拿下了 10 节点榜单的第一名,把世界纪录提升了 146%!
这无疑是“荣登”实体清单之后的一次汹涌的自我证明。
ParaStor 和 IO500 登顶成绩。
分布式存储是曙光存储的传统艺能,也是郭照斌本人奋斗了多年的领域。即便如此,这个成绩还是有点超越了他的想象。
也正是从那时起,集中式存储团队心里萌生了一个想法:集中式全闪存储也要证明自己!
3000 万 IOPS,就是那时定下的目标。
实际上,老师傅想要挑战的目标是:做到单集群百控级扩展,1 亿 IOPS。
而在 SPC-1 的测评中,一般会使用 32 个主控的系统。简单除一下,这个规模的系统应该要达到 3000 万 IOPS。
于是,老师傅一边朝着这个指标努力,一边抽空和 SPC 联系。由于相隔大洋,只能用邮件沟通,有时候一来一回就要一个礼拜。
2024 年夏天开始,好不容易拿到了测试系统,老师傅赶紧部署下去跑分试试。
结果,就在快要跑到 3000 万 IOPS 的时候,测试系统就闪退了。。。
老师傅咂嘴。看来咱水平还是有待提高啊,继续反躬自省吧。
自省了半个月,老师傅越发觉得不对劲。有没有一种可能。。。是测试程序。。。有问题?
又开始了几轮漫长的邮件沟通,SPC 的技术团队终于确认:不好意思,我们的评测系统从没跑过 3000 万 IOPS,确实存在 Bug,等我们 Update 一下。
为了见证一个世界纪录,连赛场都得重修一次,也算是活久见了。
时间终于来到了 2024 年秋天。顶级全闪存储的软件和硬件终于打磨光亮,测试程序也及时更新,文章开头的那一幕终于出现了。
这个打榜的存储系最终形态是:
32 个主控,每两个主控互为备份,总共是 16 组“仓库”,各个仓库之间由高速网络互联,可以实时进行信息同步,保证它们连接在一起,共同成为一个超大的变形金刚。
这就是 FlashNexus 全闪服务器,前面的 25 个格子,就是 25 块闪存盘的位置。
这样一个每秒可以进行 3000 万次存取响应的人造物巅峰,完全有能力进入大银行的心脏,记录海量刷新的账目;有能力进入电信系统,记录所有人的话费实时消耗;有能力进入石油系统,支持超大规模 AI 来分析地震波,寻找更加隐秘的矿藏。
凡是国外存储系统能支撑的场景,中国存储系统都能支撑;有些他们支撑不了的,我们还能支撑。
因为我们是世界第一。
这是测试结果的完整参数
这是一场围追堵截中的登顶,一场旷日持久的尘埃落定。
客观地说,曙光并非唯一的成功者。就在 2024 年,其他头部的国产厂商也宣布推出自己的集中式全闪存储。
从这个意义上讲,中国师傅作为一个整体,踏足了曾经的技术禁区。
2025 年 2 月,SPC-1 的官方认证发布,在他们给曙光团队的邮件中如是说:
我们将会把结果发布在 SPC 的网站上,并且给所有邮件列表上的成员发送通知。
我还会在首页上添加一个通知;并非每一天都有人能刷新 SPC-1 纪录。
那之后几个礼拜,郭照斌的手机被各方信息轰炸。
不仅自己的销售团队来问,客户也托人来问,连很多友商同事都找来询问情况,因为他们的老板看到新闻,质问他们为啥不去打榜。。。
“你们的纪录有信心保持多久?”我问郭照斌。
“我当然希望保持久一些。也许一两年,也许很快就被打破。但没关系,纪录就是用来打破的,因为我们也会继续创造更好的纪录。”
和团队一起燃烧了几年生命才抵达顶峰,郭照斌却没有我想象中那么留恋。
他的平静,或许源于祛魅。
在过去的十多年,我们内心大概有一个共识:
中国技术可以做到很强。但这种强来自于已知的堆垒,而非对未知的探寻。
换句话说——中国难有受人尊敬的技术创新。
这种判断非常理性。毕竟中国的制度、学术体系、商业氛围都和西方不同,最近几十年的历史也一再证明,美国总是创新的策源地。
但就在 2025 年,一些跳脱出历史经验的事情正在发生。
DeepSeek 祭出了让世界 AI 研究者膜拜的模型推理结构,Manus 让 AI 拯救了重复劳动的社畜;宇树机器人在春晚舞姿顺滑,越疆机器人用手指捏起了樱桃。
中国技术人一如既往平凡地生活,上班打卡、下班带娃,可他们手中却不知不觉开始诞生一些世间尚不存在,并不平凡的东西。
如春雨润物,大地返青。
这是一场汹涌的祛魅。
在郭照斌心里,这种祛魅发生得更早。
2022 年,分布式存储创造了 IO500 世界纪录时,郭照斌突然有一种感觉:身边的人还是那些人,谁也没有长出三头六臂,也没听说谁菩提顿悟。
就是这些原班人马,十几年前还在琢磨模仿美国技术,七八年前还在研究如何跟紧别人的创新。也不知从那天开始,突然发现前面没人了,只好自己创造,也就拿下了世界第一。
现在的信息流通非常自由,全世界的技术人正在同一片土地上耕作,过去那样的严密封锁再也不会出现了。
冲击最高点不是不可能,只是以前没敢想。
他说。
听着他的话,我陷入了自己的回忆。
小时候,总看到那样的新闻报道:有追求的技术人舍家撇业,远渡重洋。因为最好的东西只在彼岸发生。仿佛这样的奋不顾身浸染着至深的浪漫。
但如今,我就在家门口,和这些创造了历史的技术人面对面,他们看上去和蔼平静,可能还有点儿羞涩。就像是小时候结伴上学的哥们。
我大概明白,技术人的浪漫,也许并非走到世界的尽头。而是把那些汹涌的远方带回家,成为手中的柴米油盐,脚下的寻常巷陌。
如果把这些造物搬到你面前,它们只是棱角分明的机柜。匆忙一瞥,对它的印象一定如纸片一样轻薄。
但如果安静下来,把所有的定格连缀成故事,会听到一条澎湃的河。
三十年前,老一辈技术人之所以把他们的作品称为“曙光”,寓意已非常明确。而时代变迁,后人也许终究无法重走他们的筚路蓝缕。
但一代人有一代人的使命。
山河宽广,我们永远需要无尽的算力和存力的护佑。每一个尚未抵达的世界纪录,不都是新一代技术人谱写历史的机会吗?
在和我聊天时,技术老师傅总是尽量避免华丽的词汇,他们朴实地解释自己的参数,讲解实现的方案,我听不懂他们就换个方式再讲,怎么说都不腻。
但此刻,回忆那些平淡的对话,我却如置身扁舟,漂流在那条汹涌的河上。
一个我儿时就会背,但却用了几十年才渐渐理解的诗句突然又浮现在脑海:
为什么我的眼里常含泪水,
因为我对这土地爱得深沉。
往期推荐:
有人把数据化成歌
有人把它存在山河
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing
2025-03-20 11:04:00
原创 史中 浅黑科技 2025-03-20 11:04 北京
一群师傅正在把大模型做成机甲战士。
浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试用各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。
用大模型揍黑客?
恐怕得先跟人脑学两招骚的!
文|史中
家人们, AI 已经不满足于自己卷,而是开始祸祸各行各业了。。。
最近跟人聊天, 只要三句之内你还没提到你们行业“大模型怎么代替人类牛马”,人家就觉得你这行药丸。
但这事儿怎么可能这么简单?要知道,各行业对人类技能的要求本就千差万别:
设计师得懂得视觉语言,理解空间规划;
文学编辑得理解语义空间,懂得搜索和引用信息;
工程师得有严谨的决策和推理能力。
↓↓↓
所以,不是随便装个 AI 就能起飞。
针对每个行业,AI 都得反复摩擦,选定非常特别的姿势切入才可能成功。
这里藏着真知识,值得爱智求真的浅友们研究!
最近我刚和一位网络安全硬核老师傅聊天,他和团队正在把大模型作为机械战士,用子弹和铠甲守卫我们的网络空间。
这位师傅就是潘剑锋,他也被同事称为“潘神”。
当年,他是影响一代网络安全研究者的安全工具“冰刃(IceSword)”的作者,如今,他是 360 集团的首席科学家,360 数字安全集团的首席技术官。
潘剑锋
潘神从小就是学霸, 恨不能直接把卷子翻过来做大题那种。所以他比较反对有些人“为了用大模型而用大模型”,就蹭点儿步骤分。。。
他觉得:
要么就不用大模型,要用就让它真的比人更猛!
嗯,主打一个童叟无欺。
为此,他的思路是:遇事不决,照着人学!人有多骚,AI 照抄!
这不,团队这两年总算用这个姿势撞开一条小裂缝,看到一丝光明透进来。
说起这段故事,潘神决定从一个人工智能几乎无解的“弱点”聊起。
几天前,马斯克刚刚祭出了据说是地表最强 AI——Grok 3。
有人立刻把那道经典送命题递了上去:
你看,这就是地表最强 AI 的水平。棒棒!
话说其他 AI 对于这个问题的回答也一个鸟样,就算能答对,恐怕也只是针对性地打了补丁。
因为现在的 AI 训练方法的基础是统计学,所以 AI 对世界的理解也是“统计性理解”,而非“本质性理解”。
潘神给我解释。
啥是“统计性理解”和“本质性理解”嘞?
我给你举个例子。
假设三体人派质子来到地球研究我们的生活。
他们偷拍了 1 万张日常照片,发现了我们会在一起吃“生日蛋糕”↓↓↓
他们馋了,也想试着做出来尝尝。
于是挑出了几张含有生日蛋糕的图片,做了个简单统计:
这种玩意儿大概率是矮圆柱形,滑滑腻腻的,插着一些可燃物。
然后用三体星球上现成的原料,照猫画虎把这个东西做出来:
而后,质子又从地球多拍了 100 万张照片传回去,里面有更多生日蛋糕的图片。
三体人又一统计,发现出问题了:
生日蛋糕的内部结构和外部并不一样!
在里面是一坨软软的带有空洞的物质,外面才是滑滑腻腻的材料。
他们于是又一顿忙活,从更多的数据里总结更多特征,改进了自己的蛋糕。
这回从里到外都更像地球的蛋糕了。
三体人学做蛋糕的过程,就类似于人工智能模仿人脑的过程。它展现了统计性学习的两个特点:
1、学生不是想学啥就能学,而是只有本体的某种性质展现出了统计上的特征,才能被学生注意到,才能被学会。
2、随着描述本体的数据不断增加,可能会有新的特征凸显出来,学生学到的特征越多,表现就越接近本体。
但是!这里隐藏了一个让人脊背发凉的大问题:
就算三体人再拍 1 亿张生日蛋糕的照片,把蛋糕做得再惟妙惟肖,只要他们来不了地球,无法亲自品尝,他们就永远不敢肯定自己的蛋糕和地球蛋糕的味道是完全一样的!
完全存在一种可能:
我们放的是糖,他们放的是盐,我们放的是蛋糕胚,他们放的是发泡塑料。。。
残酷的事实是:在特定的数据采样体系下,有些本质是不会展现出统计学特征的。
也就是说,“统计性理解”原则上能不断逼近“本质性理解”。但推到终极,你却无法证明“统计性理解”达到了“本质性理解”↓↓↓
于是 Bug 暗伏其中。
三体人拿出塑料蛋糕的一瞬间,不就像极了 AI 说出 9.11 比 9.9 大的那一刻么?想想看,是不是还挺恐怖的?
更恐怖的是,你不知道 AI 的脑袋里还有哪些“坑”,也不知道这些坑什么时候会出来把哪个老铁给坑了。
这个问题没有“特效药”,只有“广谱药”,就是:
不断给 AI 学习更多、更好的数据,祈祷新的数据里恰好含有重要的统计学特征,“未亡羊先补牢”呗。
但在最近,即便是广谱药也快失效了——我们遇到了“数据墙”。
人类几百年积累的知识数据,该喂给 AI 吃的都已经喂了。
地主家也没有余粮了。接下来只能靠 AI 自己合成数据继续训练,这样自己拉自己吃。。。最后会不会吃出毛病,学术界还颇有争议。
训练 AI 的数据,无法突破人类既有知识的极限,也就是“数据墙”。
基于以上,潘神的眼神开始犀利起来:
既然 AI 短期存在无法突破的能力极限,那就可以把网络安全的问题分成两类,用大模型做出两套不同的体系来解决。
一套是“快思考”,一套是“慢思考”。
1、“快思考”用来做判断题,不用绞尽脑汁解释为啥,以对服人,适合放开手脚让 AI 用自己的方式去干。
主打一个:人能干,但 AI 更便宜。
2、“慢思考”用来做证明题,必须展现复杂的思考步骤,以理服人。AI 自己搞不定,可以遵循人类老师傅已有的经验框架去干。
主打一个:AI 不够,祖传知识来凑。
这个思路,其实就是从人脑的思维方式抄的!接下来我给你展开说说。
老铁们估计都知道,“快思考”、“慢思考”的分类来自于心理学家丹尼尔·卡尼曼对人脑的研究。
一个最经典的例子就是:
你在丛林里遇到一个长条形的东西,形势容不得你花时间分析它到底是啥。快思考会在第一时间输出“危险”这个信号,给你的指令就一个字——跑!
等你跑开了一段安全距离,慢思考才跟上来。你可以详细观察这个东西的纹理、动作,然后综合判断它到底是蛇还是翔,以决定接下来的计划。
打个比方:
快思考就像一把火,短暂而绚烂地燃烧;
慢思考就像一条河,带着小船时急时缓地漂流,一段时间后才奔流入海。
↓↓↓
在网络安全领域,快慢思考也都有用武之地。
咱们这一趴先说个“快思考”的例子:
假设中哥开了家公司,办公网就像一个工业园区,里面安装的 360 安全系统就像保安大队,负责监视园区里的一举一动,以防有人搞事情。
黑客偷来一张工牌,为了寻找敏感资料,他想拿着这个工牌混入档案大楼。
黑客走到档案楼门口,这位保安只有几十毫秒的时间做出判断。如果感觉这个人不对劲就要果断拦截,否则就得放行,不能耽误人家的事啊!
传统的做法是,把所有已知的黑客行为特点都提前总结成一条条的规则,放进一个大的“规则集”里。
来了一个人,保安只要无脑对照规则集里所有的规则查一遍,就有了结论,这不就很快了吗?
但是,规则终归是死板的。
它就像特工电影里那种会触发警报的红外射线,即使数量再多,中间还是会有缝隙,聪明的特工总能找到方法绕过。
这不保险。。。
人类大脑就很灵活。
老保安队长和坏人眼神一对,就感觉他有问题。
具体哪儿有问题一时说不清,但没关系,只要觉得他有问题,就可以拦下来慢慢盘问!
现在咱有了大模型,直接用它模拟老保安队长那种说不清道不明的“直觉”来做判断,不就直接吊打黑客了吗?
听上去不错,但操作起来没那么简单。
咱们的大脑看似是一坨,实际做复杂判断时,是里面很多“脑区”相互配合的结果,就像病人的疑难杂症需要不同科室的专家会诊一样。
如果要模拟人脑识别高级入侵,“一把火”不够,得把网络安全所需的不同脑区都给训练到一个大模型中↓↓↓
这些脑区有的是看代码,有的是看日志,有的是做推理,有的是读语言,知识体系和功能都差异很大。
偏偏目前的均质大模型结构存在一个天生缺陷。
那就是,同时学习多个差异很大的知识体系,就会形成跷跷板效应:A 领域学会了,有可能 B 领域就学废了,反之亦然。
其实这个缺陷人脑也存在,你读一个博士都费劲,同时读五个风马牛不相及的博士你试试,不走火入魔才怪。
但网络安全的场景非常复杂,要想拦住顶级黑客,你还真就得读五个博士。
不搞定这个 Bug,大模型就无法在网络安全领域落地。。。
老师傅们只好退而求其次:
把不同的专家彻底分开——独立训练几个“安全专家模型”,每个专家的脑袋瓜只思考一件特定的事情,然后让他们组成一个“专家组”。
遇到复杂问题,抽调团队里相关的安全专家模型分别思考,再把结论综合起来,这不就行了吗?
行是行,但这样独立模型联合起来的团队,未免太奢华了。。。
每一个专家模型都要有语言和逻辑思维能力,这意味着它们分别要在大模型的基础上训练而成——比如是 72B 的模型。
而干一件事儿可能需要 10-20 个专家模型配合。这么一来,系统里等于是并行跑着 10 个大模型。
运行一个 72B 的模型,怎么也得需要一个装满 4 张 L20 推理卡的服务器,价格最低也要 20 多万。要是跑 10 个模型,光是机器就要 200 多万。
对于绝大多数企业来说,这都是一笔巨额开销啊!
想想看,哪个工业园区也不会把日常支出的 20% 用于给“豪华旗舰版保安队”开工资吧??
看到没,这才是大模型进入产业的真实困境。。。
看来,人脑的作业也不是这么好抄的,得上点儿狠活!
说到这,潘神终于搬出了他们的一些探索成果:
360 数字安全团队也会训练很多“安全专家脑区”,但不同的是,他们对这些脑区“提取最大公约数”——彼此共用一套大模型底座。
具体来说就是:
1、每类任务都交给一个特定的“专家脑区”,平时把这个脑区外挂在大模型底座上训练;
2、每次训练的过程中,把底座大模型的参数锁死,只改动“外挂脑区”的参数;
3、训练好 A 专家脑区,就把 A 从底座上拔下来,再插上 B 脑区,训练 B 任务。
你可以这样想象:一根火柴梗,上面能搭配很多火柴头。
这样一来,所有的专家共用了一套语言逻辑中枢,也就是那个大模型底座。每个专家脑区只负责特定的思考,脑容量就能大大缩小,大概只有 1 亿个参数。
然后,设置一个路由模块。
系统思考的时候,它会根据任务的不同给它指派“火柴头”。
每次指派之后,信息流就从大模型基座(火柴梗)烧向这个专家脑区(火柴头)。
在思考下一趴的时候,路由器会重新指派“专家脑区”。以此循环,直到所有的思考结束,最终答案呈现在眼前。
这样一来,火柴是用到哪根点哪根,火柴头平时也不占地方。
同样是一台 20 万的机器,原本只能驱动一个专家,现在却驱动 10 个专家也没问题。
这个架构,被 360 称为 CCoE(紧凑型多专家协同大模型)↓↓↓
潘神告诉我,现在他们训练了很多个“火柴头”专家,企业客户根据自己的情况,用到哪个专家就买哪个专家,跟自助餐一样丰俭由人,非常方便。
但别高兴太早。
“快思考”只能解决一半儿的问题。
我们刚才说过:快思考虽然能快速做判断题,但它的判断“不保熟”。
保安看一个人像坏蛋,虽然可以用直觉判断拒绝他进入园区。但如果背后没有理性逻辑支撑的”慢思考”,终究会存在两种问题:
一来,可能误伤好人,次数多了人家会投诉你,保安就得下岗;
二来,坏蛋痛定思痛,下次乔装打扮得更好,你可能又给放进去了,保安还是得下岗!
为了不下岗,保安必须得有环环相扣的逻辑推理能力,这在大模型技术中被叫做——思维链。
如果你用过 DeepSeek,就不会对“思维链”太陌生。
DeepSeek 在正式回答你之前,会走一段内心 OS,这个 OS,就是它的思维链。
那么,只要用这个思维链思考, 就是潘神所说的慢思考了吗?
他的答案是:No。
掌握了思维链,就像学会了功夫。
首先说,练过拳脚的人和没练过拳脚的人肯定不在一个量级,一打一个服气。
这不,DeepSeek 利用思维链给出的回答,相比之前直觉大模型(例如 GPT-4o)的不假思索直接出答案,更加有理有据,令人信服。
但功夫这件事儿,是分段位的。白带打不过黑带,黑带打不过红带,山外有山,进无止境。
咱们不妨具体看一下 DeepSeek 的功夫,它的绝招是“反思”:
你问 DeepSeek 一个问题,它会把问题拆成步骤,一步一步地往下推导。
这个思维链原本像一条河流。
小船自然地随着水势自然流淌,永远不会意识到自己在随波逐流,更不会“主动”倒船选择更顺的路↓↓↓
但是,DeepSeek 不同,如果推导过程中出现了矛盾,它居然会倒带,修改之前的思考方向。这就是反思!
直到它撇出一条顺滑的结论,才算是走通了一条思维链↓↓↓
用同样的方法,它还会给出几条思维链,最后再反思一下,沿着最顺滑的那条思维链给你输出答案。
这很不寻常。
因为,只有在思维之河之外存在某种监督机制,才能对小船的航向有感知和反思。
这种监督机制,恰恰是人脑的特色。
DeepSeek 之所以被全世界竖大拇指,最大的功劳就是:工程师没有把这种反思能力强加于模型,而是找到了方法,让模型自己进化出来。
在 DeepSeek R1 的论文中,老师傅展示了一段思维链,AI 在思考过程中,直接用人类的口吻来了个“aha”,这意味着它有了反思,开始重整思维链。
但潘神提示我:作为人类,咱可不只有“反思”这一个绝招。
人在为思考按下暂停键时,除了“闭眼向内求”——通过自省来重新修正自己的思维链,还会“睁眼向外看”——借助工具和信息渠道,从开放世界拿回最新鲜的数据,辅助生成接下来的思维链。
据此,有关思维链的段位,潘神总结了三级:
第一级:类似于 GPT-4o 这样用直觉输出答案,是“快思考”;
第二级:类似于 DeepSeek 和 GPT-o1 这样有向内看能力的思维链,可以叫“深度思考”;
第三级:在反思型思维链的基础上,还能主动吸收外部信息,一边向外看一边想,才是更完整的“慢思考”。
要达到第三级,才能处理网络安全的诸多问题。
但现实很残酷。DeepSeek 的训练资源和技巧已经是当前世界顶级了,要想在它的基础上改进,技术难度提升可不止一点半点。
但他不打算坐在原地抱怨,而是想办法使“巧劲儿”。
遇事不决,照着人学。
让我们观察一下自身,咱们思考问题的时候,啥时候会去查一些信息?
一般是我们“拿不准”的时候。换句话说,当我们需要“不能错的信息”时。
咱们就以网络安全场景为例,不能错的信息大概有四种:
1、精确的通识。比如:网络安全行业处理黑客攻击的《最佳流程手册》。
2、专有的数据。比如:L 黑客组织,360 公司历年捕获到的它曾用过的攻击手法。
3、实时的事态。比如:W 系统最新爆出的漏洞详情代码。
4、工具的输出结果。比如:利用扫描工具检查网域内的设备后,绘制的网络地图。
这几种信息的来源也不同:
通识一般以知识图谱的形式存在,专有数据在数据库里,实时事态一般要联网查询,工具一般要靠智能体去调用。
潘神他们索性把这几种东西打包起来,做成了一个“外脑”↓↓↓
AI 在思维链的形成过程中,可以随时停下,调用这个外脑来补充信息,然后再继续思考,就好像人的“联想”一样!
看到这你也许会疑惑:DeepSeek 不是有个“联网搜索”功能吗?这不已经是联想了吗?
还是有区别的:
DeepSeek 是在思考之前先搜索,然后带着搜索内容开始生成思维链。思维链在延展的过程中,是不能停下吸纳新信息的。
这就好比只在河流的发源地汇入一股水流。
你没办法预测后续具体会用到什么信息,只能不管后面有用没用,先一股脑多输入一些。
而“联想”则是在河流流淌的过程中,随时汇入支流。
由于前面已经完成了一部分思考,此时应该非常清楚急需什么,可以有针对性地搜索、纳入这些信息,让接下来的思考更锋利。
显然,联想这个特点更拟人。
但问题是,目前还没有一种方法,可以让大模型在思考的过程中主动产生联想的“欲望”。
这咋办?
潘神团队研究出一个看上去粗暴,但着实有用的方案:既然敬酒不吃,那就吃罚酒呗!
在模型思考的框架里加入“强行联想”的功能。
具体来说就是,思维链每行进一步,都有一个外部的算法对它进行评估,一旦发现思考的内容符合条件,二话不说直接激活外脑。
这个算法其实没那么复杂,甚至也不是一个大模型。
你可以把它想象成河流当中的浮标,只要思维的深度触碰到浮标, 就主动开闸,引入一条支流,把新信息合并进来继续作为下一层思考的输入。
这个带有实时联想功能的思维链,被他们称作 CoAT(Chain-of-Associated-Thoughts),也就是“联想思维链”。
你感受一下全过程↓↓↓
高级的食材只需简单的烹饪,虽说 CoAT 实现方法并不复杂,但效果还挺显著的。
潘神给我看了一个例子,分别用 CoAT 架构的“慢思考大模型”和 DeepSeek 的“深度思考大模型”来解答同一个问题。
问题是这样的:
我们应该如何看待人工智能在当代国际竞争中的作用?哪些国家在这一领域拥有领先的优势?
DeepSeek 发挥稳定,答案很详细,但美中不足是例证较少。
CoAT 的不同点是,它列举了几个具体国家的 AI 策略,并且提供了美国 AI 研究的具体项目和中国的“新一代人工智能发展计划”。
之所以会有这样的区别,大概正是因为 DeepSeek 只在最开始的时候搜索了外部信息,而 CoAT 是在思考的每一步都通过外脑查询相关的信息,从而可以更具体。
这是回答上述问题的完整思维链生成过程,可以看到在每一步都和红圈内的外脑交互,进行了“联想”。(点击看大图)
潘神告诉我,这种优势在思考网络安全的专业问题上会表现得更明显,他们正在紧锣密鼓把这些能力加持在 360 的大模型安全产品里,客户很快就能体验到。
但天下武功都有走火入魔的可能,这种“强行汇入支流”的操作也暗藏危险:
在思考中添加外脑的信息,并不一定总是会让思考结果更好。
原因很简单,如果汇入的支流里面有泥沙,就会让本来一条清澈的河流变得浑浊。
所以,如何筛选和精简外脑的“信息水流”,是至关重要的。
他们于是在每一条汇入的支流入口处,都加了一道“水闸”。
这个水闸其实就是一个评估算法,来计算内容和已有思维链生成内容的相关程度。
只把最相关最核心的内容放进主河流,其他的信息主动放弃,主打一个宁缺毋滥!
↓↓↓
潘神特别提醒我,CoAT 只是一种技术框架,里面所有的参数都是可以调整的:
在网络安全领域,对思维链的聚焦度要求比较高,就可以决定只在关键节点汇入支流,汇入的水流也少而精确;
而在其他领域,比如辅助写作,完全可以更多地汇入信息,每次加入丰富的数据,让结果变得更加发散,更有趣味。
360 的老师傅合计了一下,觉得这些研究对很多行业都有用,于是把一部分研究成果写成了论文分享了出来。
这个操作很快引来了一些“自来水”。有人录视频、写文章分享他们对这个技术进展的解读。
一位外国程序员小哥做的视频解读。
这并不太意外,毕竟如今 Made in China 的技术也是品质的保证嘛。
实际上,随着前几天 DeepSeek 对技术的披露,人们逐渐意识到:
“颠覆性创新”很多时候是由一系列“实践创新”集合而成的。
DeepSeek 的每一个创新都很具体,比如 GPU 优化、通信库、文件系统。。。但合在一起就有奇效!
如此说来,像 360 老师傅这样的实践型创新同样值得被我们点赞。
无数这样的大小创新集结起来,才把我们一步步推向那个“智械黎明”。
网络安全也许是大模型的光亮最难照射进去的几个行业之一。
它是战争的线上版本,是全人类最顶尖头脑之间的攻防。人脑尚且不够用,怎么轮到 AI 多嘴?
但大模型的光芒一旦照进去,网络安全行业又会是最闪耀的。
因为网络安全行业是“赛博原生”的。
它自古就能触及浩如烟海的底层日志,能见识最多走位风骚的攻击路径。而大模型本就是数据驱动的。如果能够找到方法完整、高效地利用这些独门数据,做出来的机械战士将强的可怕。
只是,黎明之前的暗夜太长,不知谁能坚持穿过。
大模型已经横空出世三四年了,虽然几乎所有的网络安全公司都说自己用了大模型,看上去一片火热,但如人饮水冷暖自知。
很多安全公司使用大模型的原动力都来自于行业的内卷和焦虑——本来生意就不好做,别人吹牛说用了大模型,你不说,生意就更不好做了。
在很长的时间里,残酷的迷雾一直笼罩:全行业都没有找到“特别适合大模型的任务”。
有些任务大模型能干,小模型也能干,但小模型的性价比更高;
有些任务小模型确实干不了,但人干更便宜,性价比仍然比大模型高。
现实很残酷,各个企业中的网络安全部门虽然客观上肩头责任重大,但一般却是公司里存在感最低的部门。
老板天然更注重业务,谁愿意天天关注保安队呢?
一般是哪种安保措施性价比高,人家就选哪种方法。
未来,即使是这么严苛的标准,“大模型驱动的保安”也可能被挑中!
举一个在安全运营中的例子吧:
网络流量中的一种分析任务,如果放一个人类专家在这,工资成本也不低。现在,CCoE 框架下的大模型能达到人类准确率的 90%,但运行成本远低于人类专家。
在这种表现下,无论怎么算账,大模型加持的机械战士都是这个岗位的最优选项——不出意外,它即将成为这个岗位上的钉子户。
如果从远处眺望,网络安全系统就像一艘战舰。
未来的日子里,大模型有希望在越来越多的位置上成为钉子户。一点点替代传统的规则引擎,替代人类的专家判断——如忒修斯之船一样每天替换掉一个部件。
某一天,当太阳再次升起,战舰的轮廓显形,我们也许会见证一个“智械黎明”。
我不知道这个黎明还有多远。
但我知道的是,那个黎明来自过往的每一天,来自行业中无数头铁的老师傅用微小而坚定的创新一点点撞开的裂缝。
往期推荐:
👉最 Deep 的 Seek:AI 的“终极设计图”是什么样子?
人有多骚
AI 照抄
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以搜索微信:shizhongmax。
哦对了,如果喜欢文章,请别吝惜你的“在看”或“分享”。让有趣的灵魂有机会相遇,会是一件很美好的事情。
Thx with in Beijing