送外卖的美团，跑出万亿参数大模型，靠的是全国产算力,美团外卖真的收入那么高吗

做外卖、打车、团购的美团，在AI战场上亮出一张新牌。

就在最近，美团LongCat-2.0大模型正式发布，在业内掀起波澜。若单看技术实力，它并非最优秀的那个——有评价认为，在工具调用、复杂指令执行等Agent（智能体）核心能力方面，LongCat-2.0-Preview接近Claude Opus 4.6，落后于最新的Claude Opus 4.8。

但在头部玩家动辄刷榜的今天，这样一款不算最优的模型，却获得了颇高的关注度。原因在于——LongCat-2.0是业界首个基于国产算力完成训练、推理全流程的万亿参数大模型。

训练、推理全程依靠国产算力

说到国产“模芯协同”，很多人会联想到DeepSeek与华为的合作。

4月24日，DeepSeek正式对外发布DeepSeek-V4预览版，华为同步宣布昇腾超节点全系列产品及华为云已实现对DeepSeek-V4的全面支持。

之后，新的消息传来。深圳河套学院AI训练平台项目团队联合哈尔滨工业大学（深圳）、深圳市大数据研究院、华为相关团队，在昇腾910C国产算力集群上，完成了DeepSeek-V4-Pro的全参数后训练。

所谓后训练，是在预训练基座模型完成基础上做微调、对齐优化，好比建好毛坯房后再完成精装修，与打地基、盖框架的从头训练还是有很大的不同。

LongCat-2.0从零开始，用全国产算力训练万亿参数模型，覆盖预训练、后训练到推理的全流程，证明了国产算力能独立、完整地支撑万亿模型从0到1的全生命周期。

据悉，该模型采用MoE（混合专家）架构，总参数规模1.6万亿，每个Token激活参数约480亿，原生支持1M超长上下文，可一次处理百万字级输入，模型适配Claude Code、OpenClaw、Hermes等主流Harness（智能体工程框架）。

今年4月底，美团曾发布LongCat-2.0-Preview版本，并以匿名方式接入全球最大的大模型API路由平台OpenRouter。OpenRouter数据显示，截至6月底，LongCat-2.0-Preview的总调用量已跻身全球前三。在Hermes、Claude Code、OpenClaw等Agent（智能体）场景下，LongCat-2.0-Preview的月调用量分列全球第一、第二和第三位，在Claude Code上的调用量仅次于Claude Opus 4.8。

OpenRouter数据显示，截至6月底，LongCat-2.0-Preview在Claude Code上的调用量仅次于Claude Opus 4.8。

业内人士分析，这一表现既源于该模型本身的性能，也离不开当前的定价策略——公测期输入Token促销价为0.30美元/百万Token，且提供大额免费调用额度。行业通用玩法是上线初期靠低价和免费额度冲榜、攒口碑，再逐步涨价。一旦进入收费阶段，现在的成绩还能保持多久，才是真正面临的考题。

但至少，这件事验证了一个判断：目前国产算力卡的单卡性能虽与全球顶尖水平仍有差距，但计算正确性和精度已经可以支撑前沿模型的全流程训练。对于激活存量国产芯片而言，这是一个重要突破。

让大模型学会“偷懒”

大模型技术本身，依然是业界关注的焦点。

根据公开消息，LongCat-2.0全程在国产算力上完成训练，峰值规模超过5万张国产算力卡，是迄今为止国产算力上完成的最大训练任务。

LongCat-2.0全程在国产算力上完成训练，峰值规模超过5万张国产算力卡。

国产算力集群究竟出自哪家？据业内人士推测，该集群大概率基于华为昇腾架构搭建。不过，美团方面并未对此作出明确回应。

另一个值得关注的维度，是模型层面的设计。相关技术报告显示，LongCat-2.0引入零计算专家机制等设计。“零计算专家”机制关联的是大模型的经济性问题，当总参数突破万亿级别后，单纯堆叠参数带来的性能增益已显著放缓。一个更务实的命题是——如何让大模型用得更省、跑得更快？

在当前主流的MoE架构下，大模型每次推理只调动一小部分“专家”参与计算。这样既保留了海量知识，又将单次推理的计算开销控制在合理范围内。DeepSeek-V3/V4、Mixtral等头部模型均采用此架构。

不过，该架构下每个Token激活的“专家”数量通常是固定的，无论输入文本简单或复杂，都调用同等规模的计算资源。

LongCat系列引入“零计算专家”机制，即在传统“计算专家”之外，设置了一类特殊的“专家”——它不做任何矩阵运算，只做一件事：把输入原样传递到下一层。

模型会动态判断每个Token的复杂度，简单的Token直接分配给“零计算专家”走快速通道，复杂的Token才调动真正的“计算专家”深度处理。用更通俗的话说：让大模型学会在简单问题上“偷懒”，把算力留给真正需要深思的环节。

AI业务的进攻

回到一个现实问题：烧钱做大模型，美团到底图什么？

在2025年3月的业绩电话会上，美团CEO王兴明确了战略定位——对AI的策略是进攻，不是防守。今年3月，他进一步透露，自2023年初以来，美团在资本支出和AI人才上进行了大规模投入。“除有云计算业务的企业外，美团在AI上的投入规模，大概率是国内企业里最大的，且已经坚持布局三年多。”

此后，美团核心本地商业（CLC）完成组织架构调整，正式成立AI Transformation部门，与外卖、闪购等部门平行，由前大众点评总经理牧遥负责，直接向CLC CEO王莆中汇报。

美团的野心，是成为未来本地生活需求的 “AI超级入口” 。这要求AI能精准理解用户需求并高效执行任务。王兴多次表示，要争取把美团App率先升级成“AI-powered App”。

做万亿参数大模型，是战略的一部分。王兴曾用一个比喻说明问题：“虽然大模型越来越聪明。但我们可以想象，就算爱因斯坦当秘书，让他订一个餐厅，他依然不知道那个餐厅有没有座位。这不是智力问题，而是信息问题。”

基于本地生活场景的复杂性，通用AI目前还无法可靠地管理和保障现实世界中的服务体验。美团多年积累的结构性数据优势——覆盖全品类的本地服务、实时信息、海量用户评价，以及履约基础设施，恰恰可以成为大模型训练的基础。

这也关乎一笔“经济账”。随着业务对AI依赖加深，API调用费将成为不小的投入。通过打造“技术闭环”，也有助于增强业务的灵活性与安全性。

LongCat-2.0的价值，在于为美团的AI战略提供了底层能力支撑，帮助形成“基座模型+本地生活Agent+AI生态投资”的三层体系。

接下来，就要看AI能力到底多大程度与业务肌理融合。毕竟，大模型的价值从来不在于它本身有多大，而在于它最终解决了什么实际问题。

原标题：《送外卖的美团，跑出万亿参数大模型，靠的是全国产算力》