MoreRSS

site iconTMT | 钛媒体修改

成立于2012年,致力于打造全球领先的财经科技信息服务平台。
请复制 RSS 到你的阅读器,或快速订阅到 :

Inoreader Feedly Follow Feedbin Local Reader

TMT | 钛媒体的 RSS 预览

退市头孢竟卖到千元?拨开炒作疑云,看清原研药退场真相

2026-03-26 15:54:37

(本文作者为 医药研究社,钛媒体经授权发布)

文 | 医药研究社

前段时间,一款老牌抗菌药的销售表现着实让不少人惊掉下巴:

在部分电商平台上,原本30元左右一盒的头孢呋辛酯片原研药西力欣,标价一度飙至1500元以上,身价直接翻了50多倍。就连仅剩3个月有效期的临期品,也被炒到千元以上,成了名副其实的“天价头孢”。 

如今再去平台搜索,这款药的供货量少得可怜,上架的基本都是百元以上的原装进口货,国内供货难觅踪迹。

这样的医药消费场景就很耐人寻味了:该款老牌原研药的市场处境究竟如何?为何会引来高价追捧?而与之对应的国产仿制药,又在市场中占据着怎样的位置?

产业内卷下,西力欣的中国故事落幕

西力欣这款药,算是国内抗菌药市场的“老面孔”了,其于2000年获得国内上市批文,为葛兰素史克旗下的第二代头孢菌素类抗生素,可用于敏感细菌引起的上呼吸道感染、下呼吸道感染、泌尿道感染、皮肤和软组织感染及其他感染,适用范围之大、覆盖群体之广已被市场反复验证。

不过,进入国内二十多年后,西力欣的故事还是画上了句号。

据悉,葛兰素史克于2024年7月告知经销商不再向中国市场供应西力欣片剂,合作方可继续销售终止协议前的库存。国家药监局数据库显示,该药的批准文号有效期截止日为2027年11月15日。也就是说,现在市面上能买到的西力欣,基本都是之前的存货或是零散的进口货。

而葛兰素史克主动放弃这款大众药的中国市场,也是在产业竞争中做出的理性选择。

要知道,作为抗生素市场的主力军,头孢类药物早已进入“百花齐放”的时代,尤其是在国家集采政策和一致性评价的双重推动下,国内药企的布局早已形成“卷品质、卷价格、卷剂型”的白热化格局,原研药的市场优势被不断挤压。

仅以西力欣所属的头孢呋辛酯类产品为例,国家药监局数据显示,截至2026年3月,国内获批的口服剂型超40款,除了片剂,还有颗粒剂、胶囊剂、干混悬剂等多种剂型,国药致君、苏州中化药品、淄博新达制药等多家本土药企都在这个赛道布局发力。

在2019年的国家集采中,头孢呋辛酯片的中标企业均为国产厂家,葛兰素史克的原研药并未入围,集采后的国产仿制药价格更是低至“地板价”,集采价多在4-6元区间,电商平台售价也仅几元到几十元,与原研药的定价形成鲜明对比。

从市场份额的变化,更能直观看到老牌原研药的身位:2017年西力欣在国内头孢呋辛酯片剂市场的占比仅约7%,国药致君一家则拿下近30%的份额,苏州中化药品、淄博新达制药紧随其后;另外,西力欣的院内销售额从2019年的1.44亿元,跌至2024年的1187万元,跌幅超90%。

可以说,目前国内头孢药市场早已具备充足的替代选择。而作为一款退市老药,西力欣还能实现价格暴涨,有炒作可能。比如,部分商家利用原研药的稀缺性以及市场上“原研药要绝版了”的消费焦虑,趁机抬价,硬生生将原本几十元的普通原研药炒成天价药。

也由此可以看出老牌原研药仍有一定市场影响力。只不过,从近年“原研药大撤退”消息不断来看,国产高质量仿制药、创新药正在拿回自己的主场优势。

好药的核心不变,只是更强调“创新”

西力欣退出中国市场,只是“原研药大撤退”形势下的一个小小缩影。

2025年7月,国家药监局宣布,注销56个药品的注册证书,其中外资企业的产品超过30个。同年10月,国家药监局再次发布公告,正式注销氯雷他定片等80个药品注册证书,其中41款被注销药品为进口药,占比超五成,涉及辉瑞、诺华、默克、拜耳、勃林格殷格翰等多家知名跨国药企。

这些原研药纷纷退出中国市场,原因其实大同小异,无非是市场竞争越来越激烈、产品本身逐渐老化,再加上药企自身的业务重心发生了转变。

尤其是头孢药这类比较大众化的品类,已经迭代了好几代,市面上不缺疗效更优、安全性更高的产品。参与竞争的企业多了,每家能分到的市场“蛋糕”自然就少了。

更关键的是,这类同质化程度较高的产品,并非MNC的核心产品,其作用更多是保证基本供应以及体现品牌可见度,同时不能影响核心产品的开发进程。所以,MNC总部不会为这类产品分配过多预算,甚至会有意将其边缘化。

至于当前MNC的核心业务和战略重心是什么,答案也显而易见——创新药和高利润的生物制剂。这也是近年国产创新药对外授权合作(BD)势头越来越猛的一个原因。

国家药监局数据显示,2025年我国批准上市创新药76个,创历史新高;同年创新药对外授权交易总金额突破1300亿美元,新药研发管线占全球30%,位列全球第二。

可以看出,国产创新药的爆发少不了跨国药企的助力。与此同时,国内医药市场的竞争维度也早已不拘泥于仿制药与仿制药、原研药与仿制药之间的比拼,创新药的量和质逐渐成为产业较量的重要标准。

众所周知,在医药消费中,患者追求好药的初衷从未改变,而真正的好药,从来都有一个统一的核心标准:以创新为根基,以品质为核心。

一些原研药之所以能占据市场认知的高地,也正是因为守住了“创新”的核心,从无到有攻克药物研发难题,以扎实的临床试验和长期的市场验证,树立起品质与疗效的标杆;仿制药的价值,则更多体现在守住了“普惠”的初心,以技术跟进的方式,让优质的医药成果惠及更多消费者,成为医药市场的重要补充。

但从长远视角来看,仿制药的跟进,终究只是医药产业发展的“初级阶段”。想要真正在医药市场站稳脚跟,想要与国际原研药企同台竞争,本土药企唯有走上创新之路。这不仅是市场的要求,更是产业发展的必然。

在头孢类药物市场,国内企业可以实现对原研药的精准仿制,并在剂型、规格等方面进行微创新,以更贴合临床的个性化需求;在更广阔的医药市场,本土药企可以在抗肿瘤、抗病毒、罕见病等领域实现全新突破,以获得国际市场的认可。

当然,医药创新注定是一场持久战。一方面,药物研发需要巨额的资金投入,还需要经历漫长的周期,这就要求药企有足够的耐心和实力,扛过研发过程中一次又一次的失败;另一方面,创新药想要获得市场认可,也需要时间的积淀,就像原研药的品牌光环,从来都不是一朝一夕就能形成的。总体来说,国产医药创新,道阻且长,但行则将至。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

这些爆火的「春日经济」,可不只是新“花”样

2026-03-26 15:54:35

(本文作者为 惊蛰研究所,钛媒体经授权发布)

文 | 惊蛰研究所,作者 | 成昱

声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。

随着气温逐步回升,各地花期次第而至,以踏青、赏花、春游等场景为核心的春日经济,迎来新一轮消费热潮。

从山野间的自然野趣到城市里的国风市集,从轻量随性的日常休闲到新潮多元的户外运动,多种多样的消费场景下,春日经济不再局限于单一的文旅领域,而是深度渗透至休闲、零售、餐饮、文创等多个赛道。一方面,契合了人们走出家门、拥抱自然的消费需求,另一方面也让春季市场呈现出遍地开花的蓬勃态势。

1、挖野菜:感谢大自然的“馈赠”

在中国传统民俗中,每到立春时节就会通过食用春饼、萝卜等应季食物迎接新春,象征祈福纳吉。而当下的年轻人,则用挖野菜的方式来探索别样的春天。

郊外的田野里——年轻人带着小铲子和帆布袋,涌向山坡沟渠,寻找荠菜、野葱的身影。这股被戏称为“打野”的风潮,让曾经无人问津的路边野菜摇身一变成了网红食材。

事实上,野菜的“走红”之路早在去年就初见端倪。彼时挖野菜已然成了都市青年的新宠,在沉浸式的体验中,年轻人们感受到了田野的乐趣和大自然的馈赠带来的别样满足。

与此同时,野菜所承载的童年田园温情,也戳中了当代人对慢生活的向往;而药食同源理念的深入人心,更让野菜成为年轻人“边吃边养生”的新选择。体验、情绪与健康三重需求的叠加,为野菜经济的热潮埋下了伏笔。

*图片来源:上海本地宝公众号

表面上,“挖野菜”是一场关于“饮食”的狂欢,但其实它不仅激活了户外体验场景,更带动了上下游消费链条的联动。惊蛰研究所观察到,在拼多多平台上,一些店铺里单价不到十元的“挖野菜神器”(小铲子等)销量轻松突破十万件,足见大众参与的热情之高。

部分农家乐也顺势而为,除了提供工具让食客亲手采摘,更推出现场烹饪体验,把艾草粑粑、野葱煎蛋、凉拌马兰头等特色料理直接端上餐桌,让田间鲜味与烟火气完美交融,延伸消费场景的同时,也让乡村旅游焕发新的活力。

另一边,商超与生鲜平台也捕捉到了春季限定的商机,纷纷上线春日野菜专区,蕨菜、藠头、地皮菜、红香椿、马兰头、芦蒿等热门品类,被推向家庭餐桌。而在山姆会员商店,枸杞芽、丝瓜尖芽等新品野菜,也让人们感受到了春天的“新意”。

从田间地头的采摘热潮,到社交平台的分享传播,再到餐饮、零售领域的联动发力,挖野菜这一简单的春日活动,已经延伸为一场覆盖多赛道的消费热潮。它既让人们在低成本体验中收获了治愈与满足,也为春日经济注入了鲜活而持久的生命力,更让田园野趣,成为解锁春季消费的重要密码。

2、田野餐饮:春入田野,食趣新生

“品尝”春天的方式不止有挖野菜,还有以花田火锅为代表的、更加体系化田野餐饮。

区别于传统餐饮,花田火锅的核心竞争力在于场景赋能下的流量转化能力。此类项目大多依托于连片的花海布局,采取“轻改造、重氛围”的运营模式,在不破坏农田肌理的前提下,通过简约餐位与打卡场景的融合搭建,营造出“花香与烟火气”的独特氛围。由于场景、氛围优势,花田火锅不需要投入太多的资源用于宣传推广,仅凭消费者的社交分享即可实现口碑传播,有效降低获客成本。

*图片来源:成都发布公众号

除场景优势外,食材供应链的差异化打造也成为这类业态持续盈利的关键。与城市标准化火锅店不同,花田火锅大多依托周边农户建立供应链,田间现摘的时令蔬菜、本地散养畜禽等食材,既降低了食材采购与运输成本,又以“原生态、新鲜化”为卖点形成差异化竞争,进一步提升产品附加值。

多元业态的组合延伸,也显著拓宽了田野餐饮的市场覆盖范围。从花海下午茶、围炉煮茶,到田园私房菜、田野烧烤,各类产品精准匹配家庭出行、团体宴请等不同客群需求。多种经营业态的叠加还能有效拉长消费时段,实现从午后到傍晚的全时段营收覆盖,单店盈利能力随之提升。

更深层次来看,田野餐饮的兴起是农文旅深度融合的实践,更是乡村产业赋能的重要路径,在激活闲置农田资源的同时,推动乡村产业升级。此外,配套的农特产品展销、非遗体验等业态,进一步延伸消费链条。

*图片来源:仙桃市文化和旅游局公众号

从餐饮行业的角度出发,田野餐饮的爆发不仅丰富了春日消费供给,更重构了春日餐饮的消费逻辑与盈利模式——餐饮不再是文旅消费的附属品,反而成为激活春日经济的重要因素,同时也为乡村振兴、消费复苏提供了新的切入点。随着春日经济的持续升温,这类“场景+产业”的创新模式,有望进一步迭代升级,持续拉动消费增长。

3、低空赏花飞行、高空跳伞:向云端,解锁赏花新姿态

当万亩花海进入盛放期,传统的赏花模式早已无法满足追求新潮的年轻群体与高端文旅客群。而在低空经济的新浪潮下,低空赏花飞行与高空跳伞成为这个春天最炙手可热的消费新选择。

与传统地面赏花的平视视角不同,低空赏花飞行以“上帝视角”呈现花海全貌,将田园、村落、河流与花海交织的场景尽收眼底,主打“稀缺”与“沉浸”;高空跳伞则融合极限运动的刺激与春日花海的诗意,契合当代人追求个性表达、解锁多元体验的消费诉求。

从江西共青城的万亩油菜花海到山东肥城的十万亩桃林,从四川成都的“熊猫飞的”低空体验项目到湖北龟峰山景区“直升机遨游花海+无人机自飞”的组合玩法,低空消费项目已在多地落地生根,成为拉动春日经济增长的新亮点。

*图片来源:成都文旅集团公众号

低空消费项目的走红,本质上是春日经济与低空经济深度融合的必然结果。尤其是低空经济连续3年被写入政府工作报告,各地纷纷出台配套政策,进一步推动了航空器制造、机场建设、保障服务等产业链环节不断完善。也正是在这样的背景下,低空体验的价格逐渐趋于合理,进一步释放了消费潜力。

低空赏花飞行与高空跳伞的热潮,不仅反映出消费者对个性化、高品质文旅体验的追求,也是低空经济从产业端向消费端渗透的重要体现。未来,随着低空空域开放的持续推进、运营模式的不断创新,以及配套产业的进一步完善,低空消费有望持续扩大规模,不仅能为春日经济注入持久动力,更能推动文旅消费与低空产业双向赋能,为文旅产业高质量发展开辟新赛道。

4、春日主题市集:这个春天,“集”时行乐

当春风消解寒意,城市消费市场也迎来季节性焕新。春日主题市集以鲜花、春味、手作、文创为核心元素,将春日氛围感与市井烟火气巧妙融合,成为激活商圈、景区消费活力的重要载体。

在快节奏的城市生活中,人们对轻量化、沉浸式消费的需求日益凸显,既追求便捷休闲的体验,又渴望在消费中获得精神满足。而春日市集作为轻量化消费的典型场景,其核心优势正在于精准适配多元人群需求,实现消费场景的全覆盖。

对于城市白领而言,闲暇时逛一场市集,是摆脱工作疲惫、放松身心的选择。对于亲子家庭,市集的互动体验环节与生活化场景,既能满足孩子的好奇心,也能让家长在陪伴中享受休闲时光。此外,市集也是年轻人的“社交货币收集地”,打卡拍照、挑选好物、交流体验,让社交与消费自然融合,契合年轻人的社交消费习惯。

*图片来源:上海长宁公众号

相较于大型商业活动,春日市集的轻量化优势更为突出——投入成本低、灵活度高,无需大规模改造场地,便能快速盘活商圈闲置空间、丰富景区消费业态,实现“小投入、大产出”。它不仅能直接带动鲜花、手作、文创等品类的销售,更能通过人流聚集,带动周边餐饮、零售、娱乐等相关产业的消费增长,进而形成“一站式”消费闭环,为商圈与景区注入持续的消费活力。

春日市集的兴起,折射出当代消费市场的三大趋势。第一,消费者为季节仪式感、氛围感付费,折射出消费需求从“刚需满足”向“情感体验”升级;第二,市集业态的主题化、多元化,反映了消费场景从单一购物向多元融合的转变,休闲、社交、文化体验等,都能成为消费的重要组成部分;第三,便捷、灵活、低成本的消费场景,越来越适配当下人们的生活节奏与消费偏好,这反映出轻量化消费正在成为一种新的潮流。

然而,热潮之下亦存隐忧。如今不少商场都在频繁开展市集活动,主通行动线被压缩,周末高峰期常常出现人流拥挤、通行不畅的情况,也带来了消防安全、场地损耗、环境卫生等现实问题。

事实上,这些问题也与春日市集长效发展面临的痛点相契合,要实现可持续发展,春日市集仍需突破同质化、产品质量参差不齐、安全隐患等现实难题。未来,随着消费需求的持续升级,春日市集或将进一步与线上流量结合,通过直播、短视频等形式扩大影响力,同时深度融合地域特色,成为彰显城市气质、激活消费活力的重要载体,在轻量化消费的风口下,持续释放商业价值。

5、花朝节活动:赏百花、着华服、承古礼

着汉服踏春赏景,祭花神祈求安康——曾一度淡出大众视野的花朝节,如今正重新走入人们的生活。自3月以来,不少城市都陆续官宣花朝节的活动信息:2026广州花朝节定档珠江公园、北京花朝汉服节落地北京世界花卉大观园、歙县徽州花朝节亮相徽州古城府衙广场……一场场春日雅集,正在全国各地渐次拉开帷幕。

花朝节的快速普及,一方面得益于近年来不断增长的汉服消费,带动更多新用户加入到“汉服同袍”的阵营当中。另一方面,花朝节主打体验的轻资产模式,也让更多普通人接触、了解和体验到了汉服的独特魅力。

在此背景下,也诞生了围绕场景建立的微观经济生态。例如汉服租赁凭借低成本、高便捷性的优势迅速突围,再搭配古风妆造、国风摄影的一站式服务,逐渐形成完整的消费路径,既有效降低了年轻人的参与门槛,也进一步提升了消费附加值,让汉服文化的体验更具完整性。

*图片来源:歙县文旅公众号

从商业价值来看,花朝节与汉服搭配消费的出圈,是传统文化商业化的成功实践,更是文旅消费场景的创新延伸。根据惊蛰研究所观察,各地花朝节普遍采用“公园+商圈”或“巡游+市集”的联动模式,带动周边商圈的汉服体验馆、摄影工作室、文创摊位实现客流转化。以2025年上海静安花朝节为例,活动期间,花朝节的主会场大宁公园流量超65万人次,大宁商圈四大商场周末日均客流峰值达24万人次,同比上涨17%,印证了“文旅商体”联动的巨大商业价值。

*图片来源:上海静安公众号

如今,花朝节活动不仅为春日文旅市场注入了新活力,更清晰地证明,传统文化与现代消费并非对立关系,而是可以通过场景创新实现双向赋能。随着政策对国潮文化的支持、商业模式的持续优化,以及消费者文化认同的不断提升,花朝节必将承载着汉服文化、民俗文化,走出更宽广的发展之路,让更多人在沉浸式体验中感受中华优秀传统文化的魅力,让传统之美在新时代持续绽放光彩。

6、轻量化露营:更自在的“春日逃离计划”

过去,小众、高端、高门槛是户外运动标签,数千元的专业帐篷、全套炊具,加上偏远难寻的私密营地,把大多数人挡在门外,春日休闲也只属于少数资深户外爱好者。而如今,极简松弛正在取代繁复繁琐,一种告别沉重负担、省去复杂准备的休闲方式悄然成为主流。

轻量化露营,更像是全民友好的“轻春游”,以零负担、易抵达、高适配为核心,不必远行、不必重购,城市公园的草坪、近郊随处可见的绿地,都能成为休憩打卡的好去处。极低的参与门槛,让它快速覆盖全年龄段人群:上班族忙里偷闲、亲子家庭轻松遛娃、中老年结伴踏青,人人都能以最自在的方式享受春光。

依托城市公园、近郊绿地等公共空间的开放共享,轻量化露营在提升休闲体验的同时,还有效带动了周边餐饮、本地农产品、文创市集等关联消费,把短暂的春日流量转化为长效消费增量,成为拉动城市休闲消费、助力近郊文旅与乡村振兴的新动力。

可以说,轻量化露营之所以能打动人心,是因为它卸下了所有不必要的负担,让休闲回归了它最本真的样子——轻松、治愈,且人人可得。它顺应了我们如今更理性、更“悦己”的消费心态,不再为形式买单,只为体验付费。更有趣的是,当每个人都找到了这种“家门口的诗与远方”时,一种兼顾了生活幸福感与城市经济活力的新动能,也就悄然生长起来了。

随着春日经济持续升温,轻量化露营的场景边界还在不断拓展:从城市绿地到乡野林间,从基础野餐到多元沉浸式体验,背后的消费潜力仍在持续释放。未来,当轻量化休闲成为常态化生活方式,也一定能为城市的春天注入源源不断的生机。

7、人生首野:春日不宅,向山而行

当室内健身的枯燥逐渐让年轻群体产生审美疲劳,入门级的越野跑正在凭借自然与运动的双重吸引力,迅速成为新潮生活方式,甚至“人生第一次的越野跑”也被爱好者们冠以“人生首野”的特殊成就,当成是迷上这项运动的起点。由此,当下的越野跑,正逐渐打破大众的专业刻板印象,正式走向大众化,也顺势撬动起覆盖装备、赛事、文旅周边的完整消费体系,成为春日消费市场的新风口。

惊蛰研究所梳理多家赛事信息发现,不同于专业越野跑的高强度与高门槛,入门级赛事普遍将距离控制在5-25公里之间,兼顾轻健身需求与春日户外体验,让更多人告别室内跑步机,走进山林拥抱自然。目前在小红书平台,#人生首野#话题浏览量已逼近6千万,足见这一概念的流行速度与传播热度。

风潮起,消费热。赛事报名市场的火爆便是最直观的体现。如今不少入门级越野赛一经开启报名便迅速售罄,部分热门赛事甚至和马拉松一样,需要通过抽签确定参赛资格。尽管报名费从几百元到上千元不等,依然挡不住大众的参与热情。《2024中国越野跑大数据》显示,2024年国内越野跑赛事已达505场,较十年前增长超7倍。

与此同时,装备端的消费升级也悄然展开。户外市场迎来了轻量化装备,不同于专业越野装备的高昂价格,这些产品兼顾实用性与性价比,成为年轻消费者的首选。值得一提的是,国产装备品牌凭借高性价比,正逐步打破海外品牌长期垄断的局面。

从体验到消费,“人生首野”不仅让年轻人在春日山野中找到运动的乐趣,也撬动起赛事运营、装备制造、文旅服务等多个产业板块的发展。当越来越多职场人走下跑步机,踏上真实的泥土与碎石,这场运动风潮,或将演变为一种持久而深远的生活方式变革。

8、春日限定搜集:限时美好,即时上新

春风渐暖,春日限定的热潮也以强劲势头,雷打不动地席卷消费市场。

从美妆界的樱花彩妆,到饮品行业的季节特调,再到服饰、文创领域的联名周边,各大品牌纷纷押注春日赛道——赛百味联名波普艺术家凯斯·哈林推出“春日牛油果心动”系列,益禾堂携手治愈系IP FaFaDog带来樱花季限定饮品,优衣库举办2026春夏新品展会推出亚麻限定系列与多款联名UT……以“限定”为核心的季节性消费,已成为零售市场的新亮点。

*图片来源:赛百味微信服务号

对于品牌而言,春日限定本质上是对稀缺性营销的运用,限时、限量的标签创造了天然的供给缺口,使得消费者被迅速吸引、加速决策。而联名IP的加持与季节元素的融入,既能打破品类边界、吸引不同圈层受众,又能借助季节符号降低品牌识别成本。与此同时,限定款还能将短期季节红利转化为实际营收,成为品牌平滑业绩波动、提升调性的重要手段,这也是各大品牌争相入局的核心动力。

然而,如果品牌仅仅将目光投向短期销量,便容易忽略春日限定更深层的价值。与传统的饥饿营销不同,季节限定具备可重复性与连续性,正因如此,它也成为追求长效经营的品牌持续深耕的方向,不少品牌选择打造一年一度的标志性季节产品,逐步将其沉淀为自有IP,比如瑞幸连年推出的樱花拿铁系列,已成为品牌忠实用户的“春日必选”。

但热闹喧嚣之下,春日限定经济的可持续性仍需冷静审视。仅凭营销噱头只能换来一时流量,难以建立长期消费粘性。当下年轻人的消费倾向也早已透露端倪:追逐周边限定,早已超出产品使用本身。不少消费者热衷于集齐全套限定周边,从联名包装、主题礼品到专属贴纸、IP手办,却未必对产品内核形成持久认可。

由此来看,春日限定热既是消费升级下情绪消费、符号消费崛起的缩影,也折射出行业重营销轻产品的潜在短板。当春日新鲜感褪去,真正留住消费者的,从来不是“限定”二字,而是产品硬实力与品牌温度。未来,唯有让营销噱头与产品价值双向奔赴,春日限定经济才能跳出“昙花一现”的周期,成为驱动市场长效增长的持久动力。

总结

纵观春日经济的多元打开方式,不难发现,春日经济的走红,本质是大众消费理念向品质化、轻量化、情感化、个性化升级的集中体现。人们走出家门,追寻的不只是春光与风景,更是沉浸式体验、治愈感陪伴、文化归属感与健康生活方式。

正是顺应这一消费新趋势,春日经济以自然为底色、以体验为核心、以创新为驱动,不断打破文旅边界、融合城乡资源、链接多元业态,既精准契合了大众亲近自然、松弛悦己的情感诉求,也为消费市场注入了具象可感的春日动能,让季节红利真正转化为长效的产业活力与市场潜力。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

AI 不养闲人,Sora 终成弃子

2026-03-26 15:54:32

(本文作者为 智械岛,钛媒体经授权发布)

文 | 智械岛,作者 | 霍如筠(北京)

两年前,Sora的首次亮相曾让整个AI行业为之震颤。那段长达60秒、画质堪比电影预告片的“东京街头漫步”,不仅重新定义了视频生成的边界,更让RunwayPika等一众创业公司的融资路演瞬间黯淡无光。 

彼时,业内分析师纷纷预测,Sora将像ChatGPT颠覆文本生成一样,颠覆整个视频生成赛道。 

然而,就是这样一款被誉为“视频生成GPT-3时刻”的产品,却成为OpenAI所有明星产品中第一个被主动关停的项目。 

为什么OpenAI最炫技的产品,反而最早被放弃? 

答案简单Sora之死是商业逻辑的必然。当行业从技术竞赛进入商业落地阶段,谁能率先回答“谁愿意为什么付费”这个问题,谁就能活下来。

一、Sora消亡史:早有预谋的死亡预告

Sora的关停并非突如其来回看过去两年的轨迹,每一步都有迹可循。 

2024年2月,OpenAI发布Sora,引发全球轰动,但并未开放测试接口。同年11月,OpenAI宣布Sora仅向少数视觉艺术家和电影制作人开放测试,范围极其有限。 

进入2025年,Sora的研发优先级开始明显下降,团队人员规模在一年内缩减了超过一半,多位核心研究人员被调往其他项目。2026年2月,OpenAI发布公告宣布关停Sora,一个月后产品页面正式下线。 

从高调亮相到限量测试,再到团队缩编,最后到正式关停,Sora的消亡轨迹清晰可见。 

要理解Sora为何被关停,首先要回到一个被忽视的起点:Sora从一开始就不是一个产品,而是一次技术演示。 

据多位知情人士透露,当时Sora生成一段60秒视频的算力成本高达数百美元,这一数字远超任何合理商业模型的承受范围。 

即使通过技术优化将成本降低一个数量级,单次生成成本依然在几十美元级别。与文本生成不同,视频生成的边际成本无法随着用户量增加而快速摊薄,每一帧像素的计算都意味着真实的GPU消耗。 

成本高本身并不致命。如果Sora能解决足够刚需的问题,企业用户愿意为此付费,那么数百美元的成本并非不可接受。 

真正致命的是第二个问题:Sora没有找到愿意为此付费的清晰场景。 

面向普通消费者,几百美元一次的视频生成几乎无人问津。面向专业创作者,Sora的生成质量虽然惊艳,但可控性和一致性远未达到商用标准。创作者无法精确控制角色动作、表情,无法保证多镜头的一致性,更无法对生成内容进行精细化编辑。 

一位参与Sora测试的独立电影制作人坦言,它能生成令人惊叹的画面,但无法用来完成一个具体的项目,他需要的是对每一个镜头的精确控制,而不是一个碰运气的黑盒子。 

因此,Sora陷入了一个致命的商业悖论:它太贵,无法面向大众;它又太不可控,无法面向专业市场。 

一位离职员工在社交媒体上写道,Sora在技术上是一次成功的探索,但在产品上始终没有找到一个足够大的市场。

二、OpenAI的钱袋子 

正常来讲,Sora本该拥有先占位后优化与直接关停这两种选择,想理解现在的结果,需要回到OpenAI的整体商业处境。 

过去三年,OpenAI经历了一场从非营利研究机构到千亿估值商业公司的快速蜕变。但这条蜕变之路远比外界想象的要艰难。 

2025年全年,OpenAI的总收入约为40亿美元,算力成本、研发支出和人力成本合计超过70亿美元,亏损额高达数十亿美元。 

对于一个估值超过千亿的公司来说,这种亏损速度是不可持续的。 

算力成本是刚性支出,无法像软件成本那样随规模摊薄。资本市场对亏损的耐心正在耗尽,每一轮融资都伴随着更严苛的盈利要求。 

在这种压力下,OpenAI对成本最高、回报最不确定的项目容忍度极低,而Sora恰好撞在了枪口上。 

然而,盈利压力只是一部分因素。真正促使OpenAI做出关停决定的,战略重心的根本性转移。 

2025年底,OpenAI完成了一次深刻的战略调整,核心方向只有一个从消费者市场转向企业市场。 

这个转向的动因很清晰:ChatGPT虽然拥有数亿月活用户,但免费用户占比过高,付费转化率远低于预期;DALL-E的用户增长已经明显放缓,Midjourney等竞争对手的崛起进一步挤压了其市场份额。 

OpenAI逐渐意识到,面向消费者的玩具型AI产品,无法支撑一家千亿估值公司的长期增长。 

真正的金矿在于企业市场。2025年,OpenAI与微软的合作进一步深化,Microsoft 365 Copilot的全面铺开,意味着OpenAI的技术正在嵌入全球数亿职场人士的工作流,这笔合作带来的收入远超ChatGPT订阅费的总和。 

与此同时,OpenAI推出了定制化的企业解决方案,为金融、医疗、法律等垂直行业提供专属模型服务。GPT-5的发布,重点强化了企业级功能,包括更长的上下文窗口、更高的安全性、更灵活的微调能力。 

在这一战略框架下,Sora的定位变得极其尴尬。它是一个典型的消费者玩具,炫酷、惊艳,但无法嵌入任何企业工作流,无法直接为企业创造价值,更无法带来可观的现金流被关停已然是其无法逃避的宿命。

三、活下来的对手们

OpenAI将战略重心转向企业市场、主动放弃Sora时,视频生成赛道的其他玩家并没有停下脚步它们正在另一条道路上悄然崛起。 

在美国市场,Runway和Pika选择了与OpenAI截然不同的路径。它们没有追求生成更长的视频或更高的画质,而是专注于解决创作者的实际痛点。 

Runway的Gen-3允许用户对生成内容进行逐帧编辑,Pika则推出了视频修复和背景替换等实用功能。 

这些功能虽然不够炫酷,却能真正帮助创作者完成工作。它们回答的问题是创作者愿意为什么付费,答案很清晰:为能用的工具付费,而不是为惊艳的演示付费。 

这种差异背后是两种产品哲学的碰撞。 

OpenAI做Sora,是从技术能力出发,先做出最震撼的演示,再寻找应用场景;Runway和Pika做产品,是从用户需求出发,先理解创作者的痛点,再用AI技术解决它。 

在市场狂热期,技术驱动能赢得关注和融资;在市场理性期,场景驱动能赢得客户和收入。 

中国市场的表现更加印证了这一点。当OpenAI在视频生成领域高歌猛进时,中国的AI视频创业公司从一开始就走上了场景驱动的道路。 

智谱AI的CogVideoX虽然生成时长和画质不及Sora,但重点优化了电商场景下的商品展示功能,帮助中小商家大幅降低视频制作成本字节跳动的Boximator深度整合进TikTok的创作工具链,让普通用户也能通过简单操作生成短视频素材腾讯的AnimateDiff与微信生态打通,成为公众号和小程序创作者的标配工具。 

这些中国公司的共同特点是:它们不追求技术参数上的世界第一,而是将AI视频能力与具体业务场景深度结合它们想的是如何用AI帮用户省钱 

这种务实路径的背后,是中国市场独有的优势。 

中国拥有全球最丰富的视频应用场景,电商直播、短视频创作、在线教育、广告营销,这些场景每天都在产生海量的视频需求,为AI视频技术提供了天然的试验场和收入来源。 

OpenAI在为Sora找不到付费场景而苦恼时,中国的AI视频公司已经在真实的业务场景中实现了正向现金流。 

对于OpenAI来说,Sora的关停是一次理性的战略取舍它砍掉了一个叫好不叫座的产品,把资源集中在真正能产生商业回报的方向上。 

这不仅是OpenAI的选择,也是整个AI行业正在经历的集体觉醒。 

当技术的高潮退去,留下的不是最炫的演示视频,而是那些真正嵌入人们工作生活的产品。 

Sora已死,AI视频的星辰大海,才刚刚开始。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

AI 快手的重估还没走完

2026-03-26 15:54:29

(本文作者为 海豚研究,钛媒体经授权发布)

文 | 海豚研究

快手四季报于北京时间 3 月 25 日港股盘后放出。Q4 业绩总体略超预期,亮点还是收入增长稳定下,内部提效对利润的拉动。不过细分业务中,撑估值想象力的可灵不及机构年初的乐观预期,再加上后续的行业竞争,可能导致了 2 月以来的股价调整。

考虑到目前不足 9x PE 的估值,海豚君认为该利空应该已经基本 priced-in 在持续调整的股价中。因此当管理层在电话会中给可灵翻倍增长的展望,至少说明快手的 AI 含量并未充分定价。

具体来看:

1. 经营提效继续:尽管 AI 投入在逐步确认(设备折旧成本同比增长 10%、研发费用同比增长 34%),但在基本运营类的费用上,公司做了一些控制,比如雇员费用整体增长 4%、推广营销费用同比持平。因此核心经营利润率 13.5%,同比提高 3.5pct,环比也略微提升了 0.4pct。

我们预计随着更多 AI 收入的确认,后续 AI 投入对利润的影响还会加大。至于资金是否认可这个投入对经营杠杆的削弱(即不调低估值倍数),就得看是否带来了更高的业务增速或者成长想象力——传统业务能否打破自然放缓趋势,实现增速反弹?或者是可灵能否抵抗住竞争和行业变化,维持环比增长的高成长态势?

2. 可灵不及机构年初预期:12 月可灵 2.6 版本发布,因为动作控制、音画同出的新功能优势,用户反馈较好,单月流水达到历史新高的 2000 万美元,因此今年初机构对 Q4 收入预期也顺势将从指引的 3 亿提到 3.5-4 亿元人民币区间,同时对 26 年全年预期也达到了近 20 亿收入,即增长近乎翻倍的乐观预期。

实际 Q4 收入 3.4 亿,处于指引与市场预期的下沿。一般公司 preview 会和机构有一些沟通,再加上 12 月冲高后 1 月快速滑落(iOS 端),2 月可灵 3.0 虽有更新,但 Seedance 2.0 爆火,也影响了可灵流水的反弹,因此很可能机构预期顺势已经做了向下调整,从而压制了快手 2 月以来股价表现。

不过电话会上公司透露今年 1 月 ARR 的更新(超 3 亿美金,环比去年 12 月增长 25%),表明可灵流水并非如外部数据显示的整体走弱。海豚君认为,这可能是第三方数据仅统计了 iOS App 端的问题,实际上作为本质上属于生产力场景的平台,表现更亮眼的 B 端收入(占比逐季提升,Q3 占比为 40%)应该主要体现在 PC 端,而这恰恰是第三方数据口径缺失的部分。

3. 电商增长稳定:Q4 电商 GMV 增速 13%,相比上季度有所放缓,全年近 1.6 万亿交易额。在达人选品分销、全托管以及超级链接服务下,整体电商佣金变现率同比提升 8bps(环比则因旺季佣金返点增加而下滑),使得电商收入同比增速近 22%,小幅超出头部机构预期(18%yoy)。

4. 广告小超预期:Q4 营销广告收入增速 15%,相比三季度继续微幅回暖,小幅超市场预期。市场或担心消费大环境、同行竞争以及投流税影响,对广告增长的预期并不算高。不过关于投流税影响是否会在 2026 年进一步扩大,建议关注电话会管理层交流。

增长主要受益去年低基数,稳定的电商增长,持续高热的短剧(包括 AI 漫剧)&小游戏以及推荐大模型 OneRec、UAX 全自动投放(在外循环广告中的消耗渗透率达到 80%,环比增加 10pct)、AIGC 广告营销工具的增量带动。

5. 直播有预期之内的压力:Q4 直播付费下滑 2%,相对疲软,主要受行业萎缩趋势,以及自身对健康生态的调控。

6. 用户生态稳定:目前平台发展已经成熟,因此用户指标基本保持稳定,月活 7.4 亿,日活 4.1 亿,同比低个位数增长。粘性 55%,用户时长也同比持平。

7. 股东回报或有提升可能:四季度股价调整,公司回购力度加大,全年共回购 32 亿 HKD 股票,同时宣布派息 30 亿 HKD,合计来算股东回报 2.7%。目前快手账上现金充裕且近期股价再度承压,因此海豚君猜测可能在静默期后继续维持大力度的回购,具体可看电话会管理层如何表述。

8. 财报详细数据一览

海豚君观点

Q4 业绩不算差,尤其是在当前大约 9x P/E 的估值水平下,隐含市场预期也已经下调甚至趋于保守。不过,市场的担忧也并非完全没有道理——用户增长接近停滞,并不能对传统业务在政策环境(投流税&实物消费低迷)、同行竞争下,给到一些 “额外” 的支撑。因此可以说,快手的增长希望基本在 AI 上,包括广告端,ToC 的 AI 漫剧,ToB 的 AI 数字营销、AIGC 解决方案带来的增量收入,以及关键业务 “可灵”。

AI 对广告端更多的是降低收入增速放缓的速度,可灵则是完全的新业务增量,也是真正让资金眼前一亮的故事。从去年 Q2 可灵流水起爆后,资金很快对快手进行重估——大多按照高成长预期,给到 35x P/S 的估值预期。

可灵的高估值预期,也导致了短期流水变动对快手整体估值增量的变动影响较大。比如 1.5 亿美金的 ARR 收入和 3 亿美金的 ARR 收入,对快手的估值影响就是近 350 亿 HKD 的波动(等于当下市值的 15%),更何况实际资金在去年对可灵远期收入的乐观预期还要更高,也意味着对估值波动的影响更大。

目前市场对 26 年的业绩预期,海豚君认为总体偏中性:

1)传统业务预期增速 8.5%,相比今年 11.7% 增速有明显放缓。我们认为,这个预期保留了投流税、竞争等影响下传统业务增长放缓的预期对冲;

2)受益于 12 月 2.6 版本和 2 月 3.0 版本中亮点功能的上线,电话会中公司披露今年可灵 1 月 ARR 已超 3 亿美金,并指引 26 年可灵增速至少翻倍(即 21 亿人民币以上),高于市场的增速预期(+85%yoy)。而市场参考的 iOS 流水变动趋势,则遗漏了占比越来越大但不能很好跟踪的 ToB PC 端表现。

因此总体算中性的收入增速预期,就算考虑到 AI 投入对利润率的影响再做一些调整:我们假设 AI 影响利润率 2pct(140 亿资本开支,5 年折旧分摊),但同时原成本费用率优化 1.5pct,抵消后等于 25 年利润率向下调整 0.5pct。那么当下 300 亿美金的市值,预计对应传统业务调整后的 PE 为 9.5x,对比电商同行也处于基本合理区间。

换句话说,当下市值几乎并未定价多少可灵的估值。哪怕土味标签还未完全撕掉,也不能忽视快手的 AI 新标签。

以下为详细图表

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

油价暴涨冲10!燃油车主心态崩了,“油换电”的觉醒浪潮已来?

2026-03-26 15:54:26

(本文作者为 新能源行业观察,钛媒体经授权发布)

 

文 | 新能源行业观察

国际原油价格正在经历一场剧烈的震荡。地缘政治的阴云迟迟未能散去,油价像脱缰的野马一路狂奔。

近日,新一轮成品油调价尘埃落定,汽油每吨上调1160元,柴油每吨上调1115元。折合到零售端,92号汽油平均上涨约0.87-0.93元/升;95号汽油平均上涨约0.95-0.99元/升;0号柴油平均上涨约0.95元/升。

以北京为例,92号汽油由每升7.64元调整为8.57元,提高了0.93元;95号汽油由每升8.13元调整为9.12元,提高了0.99元;0号柴油由每升7.34元调整为8.31元,提高了0.97元。

图/成品油价调控措施,来源/互联网 新能源观截图

这是2026年以来成品油的第五次涨价,创下近年来单次涨幅的新高。

对于无数燃油车主来说,这不仅仅是一串数字的变化。每一次加油枪跳动的数字,都在刺痛着他们的神经。曾经引以为傲的内燃机轰鸣声,如今听起来更像是钱包在哭泣。

油价飙升不再是短期波动,而是一股强大的推力,世界各国都在思考未来的能源安全格局,中国汽车行业也在从消费端、销售端、厂商端重塑生态格局。

1. 消费端:燃油车主的“算账觉醒”

油价涨到多少,会让你开始认真考虑换一辆电动车?对于南京的张泽(化名)来说,这个临界点就是现在。

张泽是一名“油车拥趸”,开了六年大众迈腾,2.0T的发动机,每天通勤50公里,一个月跑1500公里是家常便饭。他一直觉得电车有续航焦虑,充电也不方便,对现在满大街跑的新能源车有些瞧不上。

3月24日调价后,他认真算了一笔账。

按照他百公里10升的油耗计算,95号汽油从8.11元涨到9.08元后,每天通勤的油费就从原来的40元直接跳涨到45元,一个月下来多出近150元,一年就是将近1800元,油费总数也就从每年大约14600元来到了16400元。

同样是每天50公里的通勤,如果换成一辆主流纯电轿车,百公里电耗大概在14度。用家用充电桩,夜间谷电每度只要0.3元,一天的“电费”仅仅2.1元。这意味着,开燃油车一天的成本,足够电动车在家充桩上跑半个多月。

图/低谷电价-油价调整,来源/互联网 新能源观截图

即使全部用公共快充桩,按每度1.5元算,一天也就10.5元,每个月就能节省千把块。

这笔账算下来,张泽的心态彻底变了。

所以当前几天在朋友圈刷到油价即将暴涨的消息后,他接着就给江宁区一家新能源汽车门店打了电话,预约了周末的试驾。“以前觉得换电车是为了尝鲜,现在油价往上涨得这么猛,我觉得早晚都得换了。”他在电话里对销售这样说。

张泽不是个例。中国汽车流通协会近期的一份用户调研数据显示,81.2%的燃油车用户在换车时会优先考虑新能源汽车,其中43.7%的人明确表示会转向纯电车型。

图/动力类型置换变化情况,来源/互联网 新能源观截图

要知道,一年前“油换电”的比例还不到六成。算账,成了燃油车主觉醒的第一步,也是最关键的一步。这波油价的暴涨,正加速完成消费者心智中从“尝鲜”到“刚需”的转变。

对于高频用车人群——每天长距离通勤的上班族、网约车司机、经常跑短途城际的商务人士来说,油电成本差的感知尤为强烈。

以前油价在7元、8元的时候,大家还能自我安慰“电车不保值”“充电不方便”,但现在油价暴涨,这些顾虑在真金白银的省钱面前迅速被瓦解。

这也反映在了二手车市场,全国各大城市的二手车市场里,燃油车的置换需求正在集中释放。很多开了三五年、车况还不错的燃油车,趁着还有比较可观的残值,正被越来越多的车主趁早选择“油换电”。

2. 销售端:“油电成本差”的精准收割

消费者心态变了,嗅觉最灵敏的永远是市场一线。新能源汽车的终端门店,在刚刚过去的这个周末,迎来一波久违的客流小高峰。

北京的一家蔚来中心,上个周末到店客流比平时增长了近三成。销售顾问明显感觉到,进店的客户“问的问题变了”——以前客户最关心续航多少、充电快不快——现在一进来就问“你看看我那个油车能抵多少钱”“电车一年能省多少油费”。

图/油价大涨后蔚来门店客流火爆,来源/互联网 新能源观截图

消费者想算账,销售端就帮他们把账算到极致。一场围绕“油电成本差”的营销内卷,正在终端门店悄然升级。

不少新能源品牌门店里,都摆上了一块醒目的“油价计算器”电子屏。客户只要输入自己燃油车的排量、日均行驶里程,屏幕就会自动算出一年下来的油费支出,并与同级别纯电车型的电费进行直观对比。

巨大的数字反差,比任何销售话术都更有说服力。

一些新能源品牌推出了“油车置换专项补贴”,还有的对置换用户推出了“8年低息”“0首付”等金融政策,大大降低了从油车切换到电车的门槛。“油车换电立减”“置换享额外折扣”成为这个月最打动油车车主的促销标语。

图/新能源车企各种优惠活动,来源/互联网 新能源观截图

此外,“充电桩免费安装”“终身免费保养”等售后保障,正试图一次性打消油车车主对充电和维保的顾虑。销售顾问甚至会主动帮客户联系二手车评估师上门收车,将置换流程压缩到一天之内完成,真正做到“无缝衔接”。

促销的多元化背后,是新能源车企对市场红利的精准捕捉。他们很清楚,这一波涌进门店的客户,不是传统意义上的“科技尝鲜者”,而是被油价逼出来的“成本敏感型”用户。

他们对续航、智能驾驶的追求可能没那么极致,但对“省钱”“省心”有着极高的要求。因此,简化置换流程、降低购车门槛、突出长期经济性,成为打动这批用户的关键。

销售端的“内卷”,表面上是在卷价格、卷服务,本质上是在卷谁能更快、更准地承接住从燃油车市场溢出的庞大需求。而这场战役的胜负,将直接决定接下来几个月的新能源汽车销量排行榜座次。

3. 厂商端:加码推广“乘胜追击”

如果说消费端的觉醒是“天时”,销售端的发力是“地利”,那么厂商端的加码,就是决定这场新能源替代战役能否持续深化的“人和”。

面对油价上涨带来的历史性机遇,各大新能源车企显然不想只当“机会主义者”。他们正在从品牌推广、产品交付、售后保障、供应链优化等多个维度全面出击,试图将短期红利转化为长期优势。

推广力度正在全面升级。某新能源品牌3月中旬上线了主题为“告别油价焦虑”的系列广告,线上线下同步铺开。

广告没有过多渲染智能驾驶、豪华配置,而是聚焦在“低成本出行”这一个核心卖点上:“一公里一毛钱,油价再高,与我无关。”这种简单直接的表达,精准击中了燃油车主的心理防线。

短视频平台上,新能源品牌通过大量真实车主的“油转电”经历分享,用“真人真事”的传播方式,强化纯电和增程车型的省钱属性。评论区里,越来越多的燃油车主开始留言询问置换细节,互动热度远超以往。

图/新能源车主分享“油转电”经历,来源/互联网 新能源观截图

产品与服务同样在加速优化。面对激增的订单,特斯拉上海超级工厂近期调整了生产节奏,Model 3和Model Y的交付效率明显提升。

图/特斯拉交付效率提升,来源/互联网 新能源观截图

售后体系也在快速跟进。多家车企针对置换用户推出了“三电终身质保”“免费保养”等专属政策。有车企还联合保险公司推出了“油转电专属保险套餐”,覆盖旧车处置到新车使用的全流程。让油车车主在置换时,犹豫再少一分,安心再多一点。

从更长远的角度看,这场由油价飙升引发的行业变局,正在推动厂商进行更深层次的战略调整,借势加速抢夺燃油车市场份额,尤其是原本属于合资品牌B级车、豪华品牌入门级车的市场空间。

不可否认的是,虽然技术进步与成本优势构筑的护城河,远比一次油价波动更加宽阔和深邃,但当油价这把火越烧越旺,当越来越多的燃油车主开始算账、开始走进新能源门店、开始真正体验电车带来的低成本出行,一个全新的时代正在加速到来。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

内存通胀“终结者”?谷歌公开最新极限压缩算法

2026-03-26 14:24:44

破解算力问题,降低模型所需的存算空间,有很多种途径,是减少训练时算力,还是减少推理时算力?稀疏化、量化、压缩、蒸馏等手段,都是方法之一。只是当前鉴于不同方法的优势特征,各家模型企业及研究机构都会选择不同的策略。

以长上下文任务为例,过去两年,AI算法团队曾提出要以键值缓存(KV Cache)为中心的分离架构设计,即根据不同计算特性将预填充服务器与解码服务器分开,在大batch size及队列场景下需要更大的系统内存带宽。简而言之,对于许多推理时任务来说,瓶颈在于内存带宽。

今日,谷歌发布了一项名为TurboQuant的算法,这项技术旨在解决上述提及的问题:大模型运行时的内存消耗。其核心是让AI在思考和回答问题时,占用少得多的工作内存,同时保持几乎相同的智力水平,甚至速度更快。

根据官方描述,TurboQuant的推出预计会带来多项利好:模型推理方面,百万Token上下文成本会明显下降;向量数据库领域,更容易做到实时索引和亚毫秒查询;边缘AI领域,手机和嵌入式设备的上下文推理更现实。此外,该思路同样可扩展到多模态领域的向量压缩。

事实上,就在该技术发布当日,美股存储板块如美光科技闪迪等应声下跌。近年来,内存(RAM)、固态硬盘(SSD)、硬盘驱动器(HDD)等存储产品受下游数据中心建设扩张需求的激增,出现了一段时间的供应短缺及价格推高。该市场反应可以理解为,TurboQuant一旦广泛应用,或将显著影响未来对AI推理服务器中内存容量规格的需求判断,重塑相关硬件的成本曲线。

要理解TurboQuant的价值,首先要明白大模型在生成文本时是如何工作的。它们并非一次性处理所有信息,而是像人类阅读一样,一个字一个字地生成。在这个过程中,模型需要一个“临时记事本”来记住之前所有对话的内容,以免重复计算。这个“记事本”在技术上被称为键值缓存(KV Cache)。但问题在于,对话越长,这个“记事本”就越厚,占用的内存就越多。以长文本为例,在处理超长文档或复杂多轮对话时,KV Cache会迅速撑满昂贵的高性能内存,成为制约AI处理速度、推高运行成本的主要瓶颈。

TurboQuant运用了两个结算的核心算法:PolarQuant主压缩和QJL(量化Johnson-Lindenstrauss变换)残差校正,目标是压缩KV Cache中的向量。

第一步:PolarQuant——高质量压缩

传统量化方法类似于用直角坐标系(东、北方向)记录一个点的位置。TurboQuant的第一步,是PolarQuant,改用极坐标(角度和距离)来描述。研究发现,经过特定的数学变换(随机旋转)后,高维向量的数值分布会变得非常规律和集中,就像一个固定的圆形网格。这样一来,系统可以预先计算好一套最优的压缩码本,无需针对每次对话进行复杂的校准,实现了在线实时压缩。这一步用大部分比特对数据主体进行了高质量压缩。

第二步:QJL——消除隐藏误差

第一步压缩后,会残留微小的误差。如果放任不管,在AI计算注意力(即决定关注对话中哪部分内容)时,这些误差会累积并导致结果出现偏差。TurboQuant的第二步创新在于,它用一个名为QJL的方法来处理这些残差。QJL的特点在于,它仅用1个比特(即一个正负号)来表征残差,并与高精度的原始查询向量结合,最终能实现无偏的内积估计。这意味着,尽管数据被大幅压缩,但AI在计算“哪些信息更重要”时,得到的结果依然是准确无误的。

什么是QJL?简单说,就是一种把高维向量“投影”到低维空间的方法,且能以数学证明保证距离关系不被破坏太多。QJL把这个投影结果进一步压缩到1比特,体积极小,但仍能作为无偏估计器。

根据谷歌官方博客阐述,TurboQuant带来了接近理论极限的性能提升:

  • 极致压缩:可以将KV Cache压缩到每通道仅3比特,相比传统的16或32比特存储,减少了至少6倍的内存占用。在长上下文测试中,即使压缩后,模型依然能找到隐藏的信息,表现满分。
  • 精度无损:在多个标准长上下文基准测试(如LongBench、Needle in a Haystack)上,使用3.5比特配置的TurboQuant,模型性能与使用全精度缓存时完全一致,2.5比特配置下也只有轻微的性能下降。
  • 速度提升:由于需要从内存中读取的数据量锐减,计算速度得到极大提升。在H100 GPU上,4比特TurboQuant的注意力核心步骤的速度,比未压缩的32比特版本快8倍。

TurboQuant能够以极低的内存占用、近乎零预处理时间和最先进的精度构建和查询大型向量索引。这使得谷歌规模的语义搜索速度更快、效率更高。当然,TurboQuant的意义远不止于一项实验室突破。据博客所述,向量量化虽然目前主要解决的是Gemini等模型中的KV-cash瓶颈,但该技术同样适用于需要在高维向量数据库中进行海量搜索的场景(如现代语义搜索引擎)。

相关论文将在ICLR 2026和AISTATS 2026发表。

相关链接:https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

相关论文链接:https://arxiv.org/pdf/2502.02617

(本文作者 | 杨丽,编辑 | 杨林)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App