做外卖、打车、团购的美团,在AI战场上亮出一张新牌。

就在最近,美团LongCat-2.0大模型正式发布,在业内掀起波澜。若单看技术实力,它并非最优秀的那个——有评价认为,在工具调用、复杂指令执行等Agent(智能体)核心能力方面,LongCat-2.0-Preview接近Claude Opus 4.6,落后于最新的Claude Opus 4.8。

但在头部玩家动辄刷榜的今天,这样一款不算最优的模型,却获得了颇高的关注度。原因在于——LongCat-2.0是业界首个基于国产算力完成训练、推理全流程的万亿参数大模型。

训练、推理全程依靠国产算力

说到国产“模芯协同”,很多人会联想到DeepSeek与华为的合作。

4月24日,DeepSeek正式对外发布DeepSeek-V4预览版,华为同步宣布昇腾超节点全系列产品及华为云已实现对DeepSeek-V4的全面支持。

之后,新的消息传来。深圳河套学院AI训练平台项目团队联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为相关团队,在昇腾910C国产算力集群上,完成了DeepSeek-V4-Pro的全参数后训练。

所谓后训练,是在预训练基座模型完成基础上做微调、对齐优化,好比建好毛坯房后再完成精装修,与打地基、盖框架的从头训练还是有很大的不同。

LongCat-2.0从零开始,用全国产算力训练万亿参数模型,覆盖预训练、后训练到推理的全流程,证明了国产算力能独立、完整地支撑万亿模型从0到1的全生命周期。

据悉,该模型采用MoE(混合专家)架构,总参数规模1.6万亿,每个Token激活参数约480亿,原生支持1M超长上下文,可一次处理百万字级输入,模型适配Claude Code、OpenClaw、Hermes等主流Harness(智能体工程框架)。

今年4月底,美团曾发布LongCat-2.0-Preview版本,并以匿名方式接入全球最大的大模型API路由平台OpenRouter。OpenRouter数据显示,截至6月底,LongCat-2.0-Preview的总调用量已跻身全球前三。在Hermes、Claude Code、OpenClaw等Agent(智能体)场景下,LongCat-2.0-Preview的月调用量分列全球第一、第二和第三位,在Claude Code上的调用量仅次于Claude Opus 4.8。


OpenRouter数据显示,截至6月底,LongCat-2.0-Preview在Claude Code上的调用量仅次于Claude Opus 4.8。

业内人士分析,这一表现既源于该模型本身的性能,也离不开当前的定价策略——公测期输入Token促销价为0.30美元/百万Token,且提供大额免费调用额度。行业通用玩法是上线初期靠低价和免费额度冲榜、攒口碑,再逐步涨价。一旦进入收费阶段,现在的成绩还能保持多久,才是真正面临的考题。

但至少,这件事验证了一个判断:目前国产算力卡的单卡性能虽与全球顶尖水平仍有差距,但计算正确性和精度已经可以支撑前沿模型的全流程训练。对于激活存量国产芯片而言,这是一个重要突破。

让大模型学会“偷懒”

大模型技术本身,依然是业界关注的焦点。

根据公开消息,LongCat-2.0全程在国产算力上完成训练,峰值规模超过5万张国产算力卡,是迄今为止国产算力上完成的最大训练任务。


LongCat-2.0全程在国产算力上完成训练,峰值规模超过5万张国产算力卡。

国产算力集群究竟出自哪家?据业内人士推测,该集群大概率基于华为昇腾架构搭建。不过,美团方面并未对此作出明确回应。

另一个值得关注的维度,是模型层面的设计。相关技术报告显示,LongCat-2.0引入零计算专家机制等设计。“零计算专家”机制关联的是大模型的经济性问题,当总参数突破万亿级别后,单纯堆叠参数带来的性能增益已显著放缓。一个更务实的命题是——如何让大模型用得更省、跑得更快?

在当前主流的MoE架构下,大模型每次推理只调动一小部分“专家”参与计算。这样既保留了海量知识,又将单次推理的计算开销控制在合理范围内。DeepSeek-V3/V4、Mixtral等头部模型均采用此架构。

不过,该架构下每个Token激活的“专家”数量通常是固定的,无论输入文本简单或复杂,都调用同等规模的计算资源。

LongCat系列引入“零计算专家”机制,即在传统“计算专家”之外,设置了一类特殊的“专家”——它不做任何矩阵运算,只做一件事:把输入原样传递到下一层。

模型会动态判断每个Token的复杂度,简单的Token直接分配给“零计算专家”走快速通道,复杂的Token才调动真正的“计算专家”深度处理。用更通俗的话说:让大模型学会在简单问题上“偷懒”,把算力留给真正需要深思的环节。

AI业务的进攻

回到一个现实问题:烧钱做大模型,美团到底图什么?

在2025年3月的业绩电话会上,美团CEO王兴明确了战略定位——对AI的策略是进攻,不是防守。今年3月,他进一步透露,自2023年初以来,美团在资本支出和AI人才上进行了大规模投入。“除有云计算业务的企业外,美团在AI上的投入规模,大概率是国内企业里最大的,且已经坚持布局三年多。”

此后,美团核心本地商业(CLC)完成组织架构调整,正式成立AI Transformation部门,与外卖、闪购等部门平行,由前大众点评总经理牧遥负责,直接向CLC CEO王莆中汇报。

美团的野心,是成为未来本地生活需求的 “AI超级入口” 。这要求AI能精准理解用户需求并高效执行任务。王兴多次表示,要争取把美团App率先升级成“AI-powered App”。

做万亿参数大模型,是战略的一部分。王兴曾用一个比喻说明问题:“虽然大模型越来越聪明。但我们可以想象,就算爱因斯坦当秘书,让他订一个餐厅,他依然不知道那个餐厅有没有座位。这不是智力问题,而是信息问题。”

基于本地生活场景的复杂性,通用AI目前还无法可靠地管理和保障现实世界中的服务体验。美团多年积累的结构性数据优势——覆盖全品类的本地服务、实时信息、海量用户评价,以及履约基础设施,恰恰可以成为大模型训练的基础。

这也关乎一笔“经济账”。随着业务对AI依赖加深,API调用费将成为不小的投入。通过打造“技术闭环”,也有助于增强业务的灵活性与安全性。

LongCat-2.0的价值,在于为美团的AI战略提供了底层能力支撑,帮助形成“基座模型+本地生活Agent+AI生态投资”的三层体系。

接下来,就要看AI能力到底多大程度与业务肌理融合。毕竟,大模型的价值从来不在于它本身有多大,而在于它最终解决了什么实际问题。

原标题:《送外卖的美团,跑出万亿参数大模型,靠的是全国产算力》