日期:2026年5月4日—5月10日

本周最厉害的三件事:

1️⃣ 中国大模型“清场前夜”:DeepSeek、月之暗面、阶跃星辰三天融资超70亿美元,国家大基金首次入场,国产AI估值体系一周内被彻底改写。

2️⃣ 豆包告别免费时代:拥有3.45亿月活的国民级AI助手豆包正式推出三档付费方案,行业正式告别“Token大降价”时代。

3️⃣ OpenAI全量免费+广告上线:OpenAI免费开放GPT-5.5 Instant并上线广告平台,幻觉率暴降52.5%,全球AI商业化全面提速。

一、简单说:本周AI圈发生了什么?

过去一个月,全球AI大模型经历了“史上最密集发布周”——从Anthropic Claude Opus 4.7到OpenAI GPT-5.5旗舰版、阿里Qwen3.6-Max、智谱GLM-5.1等多款前沿模型扎堆发布。而进入五月第一周,竞争主线从“参数规模竞赛”彻底转向了“资本化对决”和“商业化落地”。

中国企业成了本轮主角中的主角——DeepSeek首轮外部融资估值从4月初的约100亿美元飙升至515亿美元,月之暗面完成20亿美元新融资,阶跃星辰近25亿美元融资落地并加速冲刺IPO。三天之内超过70亿美元资金涌入头部三家公司,36氪将这形容为“‘清场前夜’”——钱不是在流向行业,而是在流向最后几个幸运玩家。

与此同时,字节跳动旗下国民级AI助手豆包正式推出三档付费服务,拥有3.45亿月活的豆包成为国内首个开启规模化付费的大模型应用。OpenAI则通过GPT-5.5 Instant全量免费、推出广告平台、发布实时音频模型等一系列组合拳,全面加速商业化步伐。

算力层面,算力租赁价格持续上涨,字节2026年AI资本开支上调至2000亿元。而在政策端,三部门联合印发《智能体规范应用与创新发展实施意见》,首次将智能体发展上升为国家战略。AI产业正从“烧钱抢位”进入“清场决赛”的拐点时刻。

二、钱都去哪了?(融资上市)

过去一个月,全球AI赛道融资持续火热。继上一轮谷歌计划重仓Anthropic、SpaceX鲸吞Cursor等大动作之后,本周中国AI企业的融资节奏密集得不可思议。

DeepSeek:从“技术清流”到“资本巨龙”

此前一直坚持“不接受外部融资”的DeepSeek,正式启动首轮外部股权融资,计划募资高达500亿元人民币,投后估值直指3500亿元人民币(约515亿美元),将刷新中国AI企业单笔融资纪录。创始人梁文锋个人出资约200亿元,占本轮融资总额的40%,确保融资后仍掌握超80%的绝对控制权。

估值飙升过程堪称“火箭式”:4月初刚启动融资时估值约100亿美元,原计划仅募资3亿美元;4月下旬腾讯、阿里入局,估值抬升至200亿美元;5月上旬国家集成电路产业投资基金(大基金)洽谈领投,估值直接跳升至450-515亿美元。腾讯曾提议认购20%股权,因比例过大被婉拒,阿里则被市场人士透露“应该没有进行谈判”。大基金的入局,释放出国产AI战略自主的明确信号。

月之暗面与阶跃星辰:国产大模型“第二梯队”加速冲刺

紧随DeepSeek之后,月之暗面于5月7日完成新一轮约20亿美元融资,投后估值突破200亿美元,由中国移动、美团龙珠、CPE等领投,累计融资已超44亿美元。华峰资本透露,Kimi的年度经常性收入(ARR)在4月已超2亿美元,付费订阅与API收入加速增长。

另一家“AI六小虎”阶跃星辰则传出近25亿美元融资即将落地,产业链资本集中入场——华勤技术、龙旗科技、豪威集团、中兴通讯等消费电子企业集体现身股东名单,剑指港股IPO。台阶已有智谱AI、MiniMax成功上市的先例——截止5月9日,智谱最新市值已突破4000亿港元,MiniMax稳定在2300亿港元。

字节AI预算再上调,算力“卖水人”受追捧

字节跳动将2026年AI基础设施资本支出预算上调约25%至2000亿元,其中约850亿元专项用于AI芯片采购,已预购超50亿美元的国产算力产品,涉及寒武纪、华为昇腾等供应商。

底层算力设施服务商无问芯穹斩获超7亿元新融资,持续稳居中国AI原生基础设施公司融资规模之首。其核心AgenticMaaS平台日均Token调用量较2025年底增长超20倍,公司将自身定位为Token经济时代的“枢纽”,类比石化产业链中的炼化厂。

三、新出来的“超级大脑”们

这一轮模型更新节奏继续加快。头部厂商的发布周期已压缩至约50天,从GPT-5到GPT-5.5仅隔数月,迭代速度创历史纪录。

国际方面

OpenAI在5月6日正式发布GPT-5.5 Instant,替代GPT-5.3 Instant成为ChatGPT默认模型,面向所有用户免费开放。核心升级包括:医疗、法律、金融等高风险领域的幻觉率降低52.5%,回复简洁度提升30%,理科能力显著增强。老版本GPT-5.3将保留三个月供付费用户迁移。

此外,OpenAI还推出了三款实时语音模型——GPT-Realtime-2等,并上线广告平台,解除微软独家授权,全面加速商业化步伐。

Meta正式推出基于LLaMA 3.5的消费级代理型AI助手,具备自主规划、多步骤任务执行和跨应用协同三大核心能力,开启“主动办事”新时代。

马斯克于5月7日正式宣布解散xAI,旗下大语言模型Grok被整合进SpaceX成为子产品。同时,SpaceX将超算集群Colossus 1转租给Anthropic——这座集群搭载了22万张英伟达GPU,算力规模达到300兆瓦。

苹果同意支付2.5亿美元和解因Siri AI宣传失实引发的集体诉讼,揭示了科技巨头在AI竞赛中过度宣传所面临的法律代价。

国内方面

百度正式发布文心大模型5.1,采用创新的“多维弹性预训练”技术,将总参数压缩至约1/3,预训练成本仅为同规模模型的6%。在国际LMArena搜索榜中,文心5.1以1223分位列全球第四、中国第一。

蚂蚁百灵发布万亿级旗舰思考模型Ring-2.6-1T,专为Agent、工程开发等复杂任务设计,创新引入可调节的推理强度机制。

商汤科技发布新一代轻量化多模态智能体模型SenseNova 6.7 Flash-Lite,采用原生多模态架构,取消视觉转文本中间层,推理Token消耗可降低60%,并已开源办公技能组件。

湖北人形机器人创新中心联合北京大学发布全球首款人形机器人动作大模型,由动作生成器MotionMaster与真机执行引擎UniAct构成,已面向全行业开源。

四、AI开始像“打工人的伙伴”

AI智能体正加速从“会聊天”迈向“会干活”,甚至开始像24小时在线的数字员工。回顾四月以来,从智谱AutoClaw能记住用户使用习惯、Anthropic的AI已能自主操作电脑,到腾讯WorkRally独立完成漫剧制作,智能体能力一步一个台阶。进入五月,AI智能体进一步从“能干活”走向“规模化付费”。

豆包告别免费,三档付费推开商业化大门

5月4日,拥有3.45亿月活、国内AI原生APP排名第一的豆包在App Store页面新增付费声明:在免费基础版之外,推出三档付费版本,最高达5088元/年。标准版68元/月、加强版200元/月、专业版500元/月,付费墙主要针对PPT生成、数据分析、影视制作等复杂生产力场景。

这一标志性动作被视作国内大模型行业告别“无限免费圈地”的分水岭。其背后根本驱动因素在于Token消耗量呈指数级增长:豆包日均Token使用量已突破120万亿,较2024年5月发布时增长1000倍。而算力成本压力早已传导到厂商端——腾讯云此前已上调模型价格最高达463%,智谱、阿里云、百度智能云也先后跟进涨价。AI产品的经济模型从“用户越多、广告越值钱”的传统互联网逻辑,转向“用户越多、算力账单越重”的全新范式。

黄仁勋:AI“智能体时代”,电力成下一个瓶颈

5月4日,英伟达CEO黄仁勋在米尔肯全球大会上发表演讲,指出AI已从“生成内容”进化到“智能体时代”——智能体算力需求将比生成式AI暴涨1000倍,当前AI产业瓶颈已从芯片转向电力供应。这一预判引发了全球数据中心建设和能源投资的新一轮热潮。

五、算力与基础设施

Token正在成为新时代的核心计价单位。国内日均Token调用量从2024年初的1000亿跃升至2026年3月的超140万亿,两年增长超千倍。Token已成为智能时代的核心计量单位。

OpenAI发布MRC新协议:突破超大规模AI集群网络瓶颈

OpenAI联合AMD、博通、英特尔、微软和英伟达发布多路径可靠连接(MRC)协议,基于RoCE标准并结合SRv6技术,向全行业开源,旨在突破超大规模AI集群网络瓶颈。随着GPU集群扩展至数十万乃至数百万规模,网络不再只是辅助组件,而是直接决定AI系统效率的核心基础设施。

算力涨价延续,行业进入“全链通胀”周期

多家机构研报指出,当前算力需求高涨,GPU和CPU已步入通货膨胀阶段。寒武纪、海光、芯原等国产算力公司业绩高增,验证行业高景气。Vibe Coding及Agent应用需求旺盛,引发全球Token消耗量激增,算力产业链进入“全链通胀”周期。

全球IT支出预计达6.31万亿美元

Gartner预测2026年全球IT支出将达到6.31万亿美元,同比增长13.5%。数据中心系统支出预计增长55.8%,全年规模将超过7880亿美元。人工智能正在成为推动资本支出、云业务增长以及基础设施重构的核心动力。

六、政策风向

三部门印发《智能体规范应用与创新发展实施意见》

5月8日,国家网信办、国家发展改革委、工信部联合印发《智能体规范应用与创新发展实施意见》。相较于此前侧重内容治理的生成式AI管理办法,此次多部门联合发文释放明确信号:智能体发展已从技术探索上升为关乎经济发展战略的国家重要议题

意见明确了安全可控、规范有序、创新驱动、应用牵引的基本原则,提出4方面举措和19个典型应用场景。此举为我国人工智能治理进一步升级——从规范大模型研发应用到引导智能体创新发展,标志着中国AI产业发展进入以应用为导向的新阶段。

科技伦理审查与服务先导计划启动、工业与能源政策密集出台

工信部正式启动人工智能科技伦理审查与服务先导计划,将率先探索落地路径。此外,工信部和国家数据局联合部署“‘人工智能+制造’走深走实”重点任务,四部门联合发文力推人工智能与能源双向赋能。人工智能终端智能化分级国家标准也已发布,将加快形成AI终端产品目录,与2026年消费品“以旧换新”政策衔接落地。

七、前瞻:清场前夜的产业大变局

36氪在复盘本轮融资潮时写下这样一段话:“当2026年5月这一周三笔70亿美元集中落地,它的含义就很清楚了,钱不是在流向行业,是在流向最后几个玩家。这笔融资越大,说明集中度越高。集中度越高,说明留给后面的人的空间越小。”。

过去两年,大模型行业经历了从“百模大战”到“清场前夜”的剧烈洗牌。2024年全球大模型产业链超亿元融资达168起,总融资额超4000亿元;而2025年模型层投资仅22笔,合计94亿元,比前一年下降52.9%。100家企业最终只有不到10家拿到钱,淘汰率超过90%。

如今国产大模型市场梯队已见雏形:智谱、MiniMax率先登陆港股并在二级市场确立定价标杆;DeepSeek、月之暗面、阶跃星辰携大额融资进入冲刺阶段;其他玩家则面临越来愈薄的生存空间。

从模型商品化到资本集中化,从智能体落地到Token经济成型,行业的核心命题正在从“谁能做出更强的模型”转向“谁能在清场之前活下去”。

下周可重点关注:苹果传闻中的AI芯片发布(有迹象显示可能在5月11日至17日之间)、预计5月至6月的下一轮模型密集迭代窗口期(GPT-6、Kimi K3、Minimax M3等值得关注)、以及DeepSeek融资落地的最终细节。