阅读: 318 评论: 0 点赞: 0 发布时间:发布日期:2026-06-16 08:40:46
6月12日,北京智源大会上,一个叫"听会伙伴"的AI智能体安静地坐在角落,实时同步着台上专家的每一句话。没人在意它,但它一直在干活。这个细节比任何PPT都有说服力——AI Agent不需要再被"介绍"了,它已经开始跑业务了。
而就在这个月的前两周,全球AI圈发生了三件值得记一笔的事:Anthropic和OpenAI双双秘密提交了IPO申请,加起来估值逼近两万亿美元;MiniMax M3在编程评测上反超了GPT-5.5;NVIDIA甩出了全球首个开源全模态物理AI模型Cosmos 3。热度很高,但我问了几个做企业的朋友,他们关心的只有一个问题:"模型一年比一年强,我的ROI怎么算?"
这个问题比任何技术指标都诚实。
先把时间线拉清楚。6月1日,Anthropic率先向SEC秘密递交S-1注册声明。一周后的6月8日,OpenAI跟上。两家不约而同选了"秘密递交"——招股书的数字暂时不公开,但市场情报已经足够拼出一幅完整的图。
数字是这样的:Anthropic当前估值约9650亿美元,OpenAI约8520亿美元。知名度更高的OpenAI反而低了1130亿。这种倒挂背后是华尔街的偏好——达里奥·阿莫迪把"AI安全"定位为Anthropic的核心商业竞争力,Claude系列在企业级市场的安全护栏确实比ChatGPT更让人放心。企业客户买的不只是能力,是可控。而OpenAI虽然有ChatGPT的全球认知度,但安全争议始终是悬在头上的剑。
不过不管谁估值更高,两家有个共同点:都不赚钱。OpenAI年营收超250亿美元,Anthropic约180亿美元——这体量放在科技行业不算小。但算力和研发的窟窿更大。OpenAI一年亏140亿美元,这个数字放在任何行业都是惊人的。
更让人捏把汗的是,OpenAI已经在俄亥俄州签了一个10GW的数据中心园区。软银旗下SB Energy开发,英伟达参与投资担保最高1000亿美元,园区总成本至少5000亿美元,租期20年,第一批设备今年下半年到位。5000亿美元是什么概念?大概相当于深圳全市一年的GDP,全砸在一个数据中心上。与此同时,OpenAI员工股权回购定价每股687.69美元,IPO窗口期定在9到11月。
说白了,资本市场正在经历一个经典的"预期差":技术跑得太快,商业模式还在找路。推理成本确实在降——DeepSeek已经把百万Token压到"按厘计价"——但训练新模型的算力需求是指数级增长的。用更便宜的价格卖更多Token,这个账到底能不能算过来,是所有AI公司今年必须回答的问题。
6月的第二个大新闻是GPT-5.6要来了——虽然OpenAI官方还没松口,但料已经足够硬。
起因是开发者在Codex后端日志里发现了一个叫iris-alpha的模型代号,上下文窗口约150万Token。GPT-5.5是100万,这一跳直接涨了50%。随后,OpenAI首席科学家Jakub Pachocki在内部消息里说"GPT-5.6相比GPT-5.5有实质性提升"。多个信源指向6月内发布。
与此同时,Sam Altman在一个活动上罕见承认了"算力成本已经是个大问题",承诺让用户"花更少的钱,获得更大的价值"。翻译成白话:我们要降价了——而且要在Anthropic降价之前先动手。这个算盘背后有背景:Anthropic的Claude Code产品爆火后,企业客户猛增,硅谷甚至出现了"是不是用太多Token了"的讨论——部分企业在2026年上半年就把全年AI Agent预算花完了。OpenAI想借GPT-5.6发布打一波价格战抢企业市场。
但IPO前打价格战会进一步压缩利润空间。年亏140亿还没止住,再降一波价,招股书上的数字会非常难看。这是Sam Altman面对的经典两难:要市场还是要利润。
再看看竞品的牌。Claude Fable 5在SWE-bench Pro编程评测上拿了80.3%,GPT-5.5是58.6%,差距22个百分点。在Artificial Analysis综合榜单上,Claude Fable 5以64.9分排第一,GPT-5.5以60.2分排第三。谷歌的Gemini 3.5 Pro也定在本月正式发布,支持200万Token上下文窗口,还带一个Deep Think深度推理模式。三家旗舰模型扎堆6月,场面的激烈程度不输手机行业每年9月的"旗舰大战"。
150万Token意味着什么?一本《三体》三部曲全塞进一次对话,模型都能记住。这条线的意义不在于"大"本身,而在于Agent执行复杂任务时必须记住完整上下文链路。多步骤的业务流程、跨系统调用、动态决策——Token够不够直接决定了Agent能不能真正干活。它不是锦上添花,是及格线。
海外巨头在卷IPO和价格战的时候,国产AI这一轮一点没慢。
MiniMax在6月1日发布了M3旗舰模型,一次集齐了原生多模态、超长上下文、高阶智能体三大能力。最出圈的数据是编程评测——M3在权威编程基准上的成绩直接超越了GPT-5.5。不是"接近"或"持平",是超越。虽然圈内对各类评测基准的有效性一直有争议,但同榜对比的数据至少说明一件事:国产大模型已经彻底告别了"追赶者"心态,开始在具体赛道上直接抢位。
同一天,谷歌发布了Gemma 4 12B——一个120亿参数的轻量多模态开源模型,支持原生音频输入,能在普通终端设备上跑。一年前,120亿参数做到原生音频多模态是不敢想的。开源生态的进化速度正在强行倒逼闭源模型提速。
DeepSeek这边动静更大。首轮融资500亿元,创下国内AI单轮融资新纪录,投后估值逼近4000亿元。投资方阵容很讲究:创始人个人大额出资,加上腾讯、宁德时代和国家AI产业基金。这个组合不是单纯的财务投资——"创始人+产业资本+国家队"的牌型,摆明了是要做生态型公司,不是做模型公司。
更关键的是,DeepSeek同时大幅下调了模型API定价,百万Token调用成本降到"厘"级。他们的逻辑很清楚:用低价把开发者生态拉到自己这边,用规模垒壁垒。这套打法中国互联网很熟——先圈用户,再谈商业。
华为云联合智谱AI、商汤科技等20多家企业启动了"百模千态"生态计划,字节跳动大幅上调2026年AI基建预算。这些信号放一起看,国产AI的竞争已经从单一模型PK变成了算力、生态、资本的全方位角力。
说句实话,MiniMax M3超越GPT-5.5这个新闻出来的时候,我的第一反应不是"厉害了",是"能持续多久"。技术领先的窗口期越来越短——今天你强一点,下周对手就追上来。真正考验的不再是评测排名,是产品化能力和商业闭环。
如果说文本大模型的竞争已经进入"你追我赶、差距不大"的贴身肉搏,那NVIDIA在6月初扔出的Cosmos 3,就是把战场扩展到了一个全新的维度。
Cosmos 3是全球首个完全开放的全模态物理AI模型。说人话就是:以前的AI模型主要处理文本、图片、视频这些数字内容,Cosmos 3对标的是真实物理世界——它能理解物体怎么运动、环境怎么变化、机器人手臂该往哪里转。它原生支持文本、图像、视频、环境音、动作五种模态,核心架构叫"混合Transformer",推理模块和生成模块搭在一起,先理解物理逻辑,再生成合理输出,解决了传统模型"先生成再圆逻辑"的毛病。
训练数据涵盖了数十亿条文本、图像、视频、环境音及机器人动作轨迹样本。效果很直接:原来需要数月的训练和评估周期,现在压缩到数天。在多项行业基准测试中——包括世界生成精度的Physics-IQ、动作策略测评的RoboArena、视觉理解的VANTAGE-Bench——Cosmos 3在开放模型赛道中都拿了第一。
NVIDIA还配套推出了Agent Toolkit,让智能体直接调用其全系技术资产:Cosmos做世界模拟、Omniverse做数字孪生、Isaac做机器人仿真、Metropolis做视觉AI、Jetson做边缘部署。黄仁勋的话很直接:"当智能体可以直接使用NVIDIA库、模型和框架时,物理AI开发速度将大幅提升。"同时牵头的Cosmos Coalition全球协作联盟,首批成员包括Agile Robots、Runway、Black Forest Labs等——三星、LG、理想汽车已经在用。这基本上是在物理AI领域画了一套标准:谁用我的生态,谁就按我的规则来。
从商业角度看,这一步的杀伤力在于:大模型厂商在卷文字和代码的时候,NVIDIA直接去卷工厂、卷机器人、卷汽车了。这些都是万亿级的传统制造业市场,AI渗透率现在还极低,想象空间比文字生成大太多。而且物理AI的壁垒不是靠参数数量能堆出来的——它在传感器、仿真环境和真实物理交互中有天然的护城河。
回看这个6月,真正有意思的不在于哪家公司的模型又拿了几个第一,而在于整个行业出现了一个微妙的分叉。
一边是文本大模型的快速趋同。GPT-5.6追Claude Fable 5,MiniMax M3追GPT-5.5——核心指标越来越接近,差异化在缩小。价格战已经打响了,DeepSeek压到"按厘计价",OpenAI准备跟进。当竞争开始靠价格来拉差距的时候,说明技术上的护城河在变浅。
另一边是物理AI和Agent的真金白银。NVIDIA用Cosmos 3撬开了制造业的入口,Agent从演示demo跑进了企业实际业务流程,微软把智能体纳入了企业软件全生命周期,谷歌用个人智能体Spark让搜索从被动查询转向主动服务。这些方向的竞争还没开始卷,因为门槛本身就很高。
对企业用户来说,今年下半年会是一个关键选择期:是跟风用一个又一个"更强但更贵"的模型,还是停下来想清楚"我的业务到底需要AI解决什么"。技术潮水退得再快,真正留下的永远是解决了具体问题的人和公司。这个判断,比任何技术评测排名都更值得记住。