阅读: 260 评论: 0 点赞: 0 发布时间:发布日期:2026-06-12 08:31:08
6月9日,微信开放了AI生态接入能力,开发者可以在小程序后台一键授权。同一天,台北Computex展上,英伟达和联发科联手把大模型塞进了手机和PC芯片。再往前一周,全球头部大模型厂商扎堆开开发者大会,Robotaxi开始收费运营,人形机器人在工厂里拧螺丝的视频不再被当成特效。
我翻了一圈新闻,发现一个特别明显的信号:整个行业的讨论焦点,从「这玩意儿能跑起来」彻底变成了「跑起来以后能省多少钱」。
大模型之家5月的热力榜标题很有意思——「当能干多久取代能跑多高」。这句话戳中了核心。过去两年大家比的是参数量、跑分、Benchmark,现在比的只有一件事:客户续费了没有。
说实话,2025年一整年,我每次看到Agent的Demo都有种看魔术表演的感觉。帮你订机票、写周报、自动回复邮件——都很酷,但如果你问企业IT负责人「你愿意为这个付多少钱」,对方大概率会说「先等等」。
2026年中的情况变了。
变化不在Agent能力本身——说实话Agent的核心逻辑一年前就成熟了。变化在三个外部条件同时到位了:一是大模型调用成本降到去年的十分之一不到,Agent频繁调API不再是一笔让人心疼的开销;二是企业数据治理终于跟上了,Agent要读CRM、调ERP、查数据库,这些系统本身的API这两年补齐了;三是老板们的心态变了——经济下行压力下,降本增效是刚需,不是锦上添花。
东方人工智能主题混合基金近期的持仓变化也验证了这个趋势。基金经理在6月的报告中提到,他们开始从纯模型厂转向「Agent落地服务商」——那些帮企业把Agent实际部署到业务流程里的公司,估值反而比做底层模型的更稳。投资人越来越清楚,大模型是水电煤,收电费的永远是电网公司,不是发电厂。
一个具体的数字:6月5日发布的大模型概念股日报显示,虽然AI及硬科技板块当日回调,但南向资金净买入27.54亿港元,其中相当比例流向了具备企业服务能力的AI应用公司,而不是纯粹的基础模型厂商。资金在用脚投票。
6月8日微信AI生态的开放,可能是这个月对中小企业影响最大的一个事件。
逻辑很简单:中国超过4000万中小企业,绝大多数没有技术团队,不可能自己部署大模型、调RAG、搭Agent。但如果AI能力直接嵌在微信里呢?
微信提供了两种接入模式:自动模式和开发模式。自动模式基本零代码,适合小商家;开发模式给有技术能力的团队更多定制空间。目前功能还在内测,但方向已经很清晰了——微信要做的不是另一个AI助手,而是让小程序开发者可以在自己的业务场景里调用AI能力。点餐小程序能自动理解用户的模糊需求,电商小程序能用AI生成商品描述,客服系统能真正理解上下文而不是关键词匹配。
说实话,这个动作比任何一篇论文都更能说明AI大模型到了什么阶段。当一个10亿用户级的平台开始把AI能力当作基础设施开放,意味着背后的成本、稳定性、合规性都已经过了及格线。剩下的就是场景的想象力了。
Computex 2026上最让我兴奋的不是某款芯片的参数,而是英伟达展示的一个Demo:端侧多模态模型在本地实时处理摄像头画面、麦克风语音和触屏手势,三种输入同时融合,延迟不到100毫秒。
这事的意义在哪?
过去的多模态更像「分工合作」——视觉模型看图、语音模型听声、文本模型写答案,三个模块分别跑,最后拼在一起。这种架构的问题很明显:中间信息丢失严重。一个表情的含义需要同时结合语气和上下文才能判断,先分别处理再汇总,精度打折扣。
2026年中的多模态模型,包括GPT-5的原生多模态能力、Google Gemini的端到端训练、国内多家厂商的跟进,都指向同一个方向:从输入端就融合。摄像头看到的东西、麦克风听到的东西、用户输入的文本,不再走三条独立流水线,而是在同一个表示空间里被理解。
这对企业应用意味着什么?举一个真实的例子:制造业的设备巡检。以前需要工人用眼睛看、耳朵听、手摸振动,经验靠年限积累。现在一个搭载多模态模型的终端,同时分析设备运行声音的频谱异常、红外热成像的温度分布和振动传感器数据,几秒钟给出诊断建议。这不是未来,苏州已经有工厂在用了。
过去一年开源大模型进步的速度,说实话超出了我年初的预期。
Llama 4发布后的半年里,基于它微调的中文模型在多个垂直场景(法律文书、医疗问诊、金融合规)上的表现,已经能和闭源商业模型打得有来有回。对于不需要最顶尖推理能力的日常应用——比如客服问答、文档摘要、内容生成——开源方案的总成本(推理算力+部署维护)大约是闭源API的三分之一到二分之一。
这事对行业格局的影响很大。大模型不再是一个「技术壁垒」游戏,变成了「数据壁垒」和「场景壁垒」游戏。你的护城河不是你用的模型比别人强多少,而是你的行业数据、你的工作流、你对业务的理解。
国内几家做垂直行业大模型的公司也意识到了这一点。他们的策略已经从「我们模型世界第一」悄悄变成了「我们最懂你的行业」。这其实是更务实的说法。
尽管上面说的都挺乐观,但我得说一句实话:企业AI大规模落地,还差临门一脚。
第一个坎:数据就绪度。听起来很基础对吧?但过去半年我聊过的十几家中型制造企业,有完整结构化数据的不到三分之一。大多数公司的核心业务数据散落在Excel表格、微信聊天记录、甚至纸质单据里。Agent再聪明,喂进去的是乱码,出来的不可能是洞察。
第二个坎:组织惯性。这不是技术问题,但比技术问题难解决十倍。一个部署了AI排产系统的工厂厂长跟我说:「系统确实算得比我准,但工人不信任它。他们还是习惯每天早上来问我今天做什么,我看了系统再告诉他们,等于多了一个环节。」人是不愿意把决策权交给一个黑盒的,这是人性,不是功能迭代能解决的。
第三个坎:ROI的隐性成本。很多企业在算AI投入时只算模型调用费和部署费,但忽略了两个大头:一是数据标注和清洗的人工成本,少则几万,多则几十万;二是业务流程改造的成本——为了让AI嵌入工作流,可能需要重新设计审批流程、调整岗位职责、甚至改变绩效考核方式。这些钱在立项报告里通常不会出现。
第一,Agent会在下半年真正进入规模复制阶段。上半年跑通了POC(概念验证)的企业,下半年大概率会扩展到更多业务线。但切记,Agent部署成功的关键不在模型精度,而在「流程适配」——谁能把Agent无缝嵌入企业已有的OA、ERP、CRM系统,谁就能拿下这个市场。
第二,端侧AI会成为一个重要的新变量。Computex上发布的几款AI PC和AI手机芯片,把推理能力从云端搬到了本地。对中小企业和个人用户来说,这意味着隐私顾虑降低了、延迟更小了、成本也更可控了。端侧多模态会是下一个爆发点。
第三,大模型定价还会继续下探。5月大模型之家的数据显示,头部模型的API调用价格已经逼近「按厘计价」。这个趋势不会逆转——开源模型的压力、云厂商的补贴策略、以及规模效应,三重力量都在往下压价格。对应用开发者来说是好消息,对纯模型厂商来说——是时候考虑怎么靠增值服务赚钱了。
回看2026年上半年,AI行业最大的变化不是某个模型又刷新了Benchmark,而是整个行业终于开始用商业逻辑而不是技术逻辑来评价AI的价值。
「能跑多高」是工程师关心的事,「能干多久」是客户关心的事。上半年我看到的趋势是,这两拨人终于在往同一个方向走了。工程师开始理解客户为什么对99%和98%的精度差异不敏感,客户也开始理解AI不是万能药,需要投入时间磨合。
下半年真正值得关注的,不是GPT-6什么时候出来,而是那些在工厂车间、医院诊室、学校课堂里默默运转的AI系统,到底有没有让人少加班、少犯错、少花冤枉钱。
这才是AI该有的样子。