- tags
- [AI, 云, MaaS, 中国, 市场结构, Token 经济, 火山引擎, 阿里, 行业格局]
- created
- 2026-05-08
- updated
- 2026-05-08
- sources
- [raw/notes/chijianqiang-idc-maas-token-economy-2026-05-08.md]
定义¶
MaaS = Model as a Service:企业通过公有云平台调用大模型能力,按调用次数 / Token 使用量计费,无需自己维护模型部署 / 硬件资源 / 模型迭代。是云计算市场在 AI 时代衍生出的新细分形态——竞争不再以"资源 + 产品矩阵"为轴,而以"模型 token 调用规模 + 工具链 + 生态"为轴。
本页基于 IDC 2026-05-07 发布的《中国公有云大模型调用量市场分析报告》整理 2025–2026 中国 MaaS 市场的核心结构性事实与行业判断。
IDC 核心数据(2026-05-07 报告)¶
2025 年实际¶
| 维度 | 数字 | 同比 |
|---|---|---|
| 中国公有云大模型调用量 | 1944 万亿 Tokens | 16 倍(2024 年 = 114 万亿,不是 16%) |
| 中国公有云 MaaS 市场营收 | 30.7 亿元人民币 | — |
| 火山引擎份额(按调用量) | 49.5% 中国第一 | 2024 年 46.4% → 2025H1 49.2% → 2025 年 49.5%,份额持续扩大 |
| 日均消耗变化 | 2025-01 ~1.6 万亿 → 2025-12 月底 9.6 万亿 | 单年 6 倍 |
统计口径:各大云厂商对外部客户(个人 + 企业)的大模型公有云服务调用量(含 Token Plan 订阅 + API 服务)。不含厂商自有业务调用 —— 即火山数据不含抖音、豆包、即梦等字节系内部产品,是真实对外销售口径。
2026 年 IDC 预测¶
| 维度 | 预测 | 同比 |
|---|---|---|
| Token 消耗 | 40000 万亿次 | 较 2025 增长约 20 倍 |
| 营收 | 186 亿元人民币 | 较 2025 增长约 6 倍 |
预测保守性观察:日均 1.6→9.6 万亿(一年 6 倍)月环比 ~17%,按此持续 12 个月即可达成 2026 IDC 预测——不是预测未来突破,是已发生增速的简单外推。
市场格局(按调用量 / 按营收两套排名)¶
| 口径 | 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|---|
| 按调用量(公有云 MaaS) | 火山引擎 49.5% | 阿里云 | 百度智能云 | 硅基流动 | 移动云 |
| 按营收 | 火山引擎 40%+ | 阿里云 | 百度智能云 | 智谱 | 移动云 |
| 私有化部署(独立赛道) | 百度智能云 | 商汤 | 电信 AI | 中关村科金 | 创新奇智 / 星环 / 中国电子云 |
关键观察: - 公有云 + 私有化部署是完全不同的格局——私有化以政府 / 国企 / 金融大单为主,火山几乎不参与 - 智谱按营收进入前 5 但按调用量没有——反映 ToB 高单价模型 vs ToC 高调用量模型的两条路径 - 硅基流动作为聚合平台型公司排第 4 是 2025 年新现象(详见 platform-layer-collapse 中间层路径)
应用场景分布(公有云 MaaS)¶
主要应用群体集中在 4 个赛道: - 泛互联网(游戏 / 娱乐 / 教育) - 智能办公 - 智能硬件(汽车 / 手机 / 智能眼镜) - 大消费
私有化部署主要集中在智能办公 / 数据处理与分析 / 市场营销
阶段性转折:从文本生成到多模态 + Agent¶
IDC 对 2025 年 MaaS 的定位是"经历了从试点到规模化应用的关键转折"。具体形态是 Token 消耗结构从"文本"切换到"多模态 + Agent":
| 阶段 | 单次任务 Token 消耗 | 实际增量含义 |
|---|---|---|
| 文本对话 / 文本生成 | 几千~几万 token | 个体使用率高但单次低 |
| Coding 任务 | 一个编程指令 200 万 token 量级 | Agent 类应用规模化标志 |
| 视频生成 | 720p 15s 视频 ≈ 100 万 token(Seedance 2.0 量级,未独立核实) | 多模态成熟 |
含义:调用量爆增不只是用户数增长,而是单次任务消耗指数级提升——长上下文 / Agent 长跑 / 多模态全部撕开 token 单次消耗。
阿里 Alibaba Token Hub(ATH):Token 三阶段框架¶
2026-03-16 阿里成立 ATH 事业群,由 CEO 吴泳铭直接负责,与阿里云智能事业群 / 电商事业群平行。整合 5 大 AI 板块:通义实验室 / MaaS 业务线(百炼)/ 千问事业部 / 悟空事业部(首次亮相,B 端 AI 原生工作平台)/ AI 创新事业部。
Token 三阶段逻辑(吴泳铭版本):
创造(通义实验室)→ 输送(百炼 MaaS)→ 应用(千问 / 悟空 / 创新应用)
≈
发电厂 → 电网 → 各式用电终端(手机 / 电脑 / 家电 / 新能源汽车)
吴泳铭 2025-09 云栖大会主张:"Token 就是未来的电" —— "AI 将替代能源的地位,成为最重要的商品,绝大部分 AI 能力将以 Token 的形式在云计算网络上产生和输送。"
这是 Naming Shapes Thinking(naming-shapes-thinking)的具体应用 —— 把 Token 从"技术单位"重新命名为"经济商品",把 MaaS 平台位置类比为"电网"(基础设施 + 资源调度 + 计费)。
与 google-agent-platform 4 pillars 的对照¶
阿里 ATH 是中国版的"AI 全栈框架",与 Google Agent Platform 4 pillars 对位但视角不同:
| 维度 | Google Agent Platform | Alibaba Token Hub |
|---|---|---|
| 切分轴 | 4 pillars(Build / Scale / Govern / Optimize) | Token 生命周期(创造 / 输送 / 应用) |
| 核心抽象 | Agent 平台 | Token 经济 |
| Govern 处理 | 独立柱(Identity / Registry / Gateway 三件套) | 未在三阶段中独立 —— 是阿里方案的明显差距 |
| 模型策略 | Model Garden 200+ 模型开放 | 通义实验室主推 + 兼容第三方 |
| 客户层 | Box / Workday / Salesforce / ServiceNow 原生集成 | 钉钉 7 亿用户 + 悟空 B 端工作流 |
两套框架共同的判断:在 Token 经济时代,云厂商的胜负不再只看模型质量,而看"模型 + 平台 + 工具链 + 客户分销"的全栈整合度。
阿里 ATH 的人才紧迫性背景¶
- 2024:原 Qwen 核心负责人周畅离职加入字节 Seed,带走十多名核心骨干
- 2026-03:林俊旸官宣离职 + 后训练负责人郁博文同周加盟字节
- 同期:阿里通义实验室面临持续人才流失到字节 Seed 的压力
- ATH 事业群成立时间(2026-03-16)紧贴 Qwen 团队震荡——ATH 是组织防御反应,把分散的 Qwen / 百炼 / 千问 / 悟空 / 创新事业部整合到 CEO 直接管辖 = "大兵团作战"对抗字节豆包 + Seed 的双线进攻
国产模型 Token 占比数据:受 OpenClaw 开源 AI 智能体热潮带动,2026-Q1 国产模型 Token 使用量占全球前十名模型总 Token 消耗的 61%——这是 ATH 战略时点的市场背景
影响大模型落地的前五因素(IDC 调研)¶
按 IDC 调研顺序:
- 模型性能 —— 排第一意味着 2026 仍是"模型还在升级"周期
- 安全合规 —— Govern 类需求开始进入选型主轴(与 google-agent-platform Govern 三件套同方向)
- 内容质量 —— 与模型性能相关但不同(输出可控性)
- 平台可用性 —— 即工具链 + 文档 + SDK + 集成度
- 成本效益 —— 当前排最后,但 IDC 主张"Token 消耗再增长 20 倍后,再小的单价差异都会被规模放大"
关键判断:成本因素当前排第 5 是因为总规模仍小(30.7 亿元),平均单客户 Token 账单还在万元到几十万元区间。当 2026 进入 186 亿元规模 + 单客户进入百万到千万 token 账单时,成本敏感度会从第 5 跃升到选型决策硬指标——这是 amphiflow-pattern / harness-engineering 等"省 token"工程能力价值上升的市场背景
单 Token 价格预期下降 ~70%¶
按 IDC 数据反推单 Token 价格走势:
| 年 | 调用量 | 营收 | 估算单价(元/万 token) |
|---|---|---|---|
| 2025 | 1944 万亿 | 30.7 亿 | ~0.0158 |
| 2026 预测 | 40000 万亿 | 186 亿 | ~0.00465 |
从 2025 到 2026 单 Token 价格预期下降 ~70% —— 调用量增长 20 倍 + 营收只增长 6 倍 = 单价持续下行。
含义: - 价格战会让 MaaS 厂商利润率被压扁,赢家只能靠规模摊薄成本 - 客户从 MaaS 拿到的"每元 token 量"持续提升 —— 同样预算下能跑更复杂任务,给 Agent 类应用降本背书 - 中间层(如 sentino-agent)从 MaaS 转售 token 给最终客户的差价空间被压缩——只能靠工程能力(cache 优化 / 路由 / 工具链)创造增值
中间层的双重含义¶
MaaS 头部聚合给中间层 Agent 平台 / 应用层创业公司带来双重信号:
正向:MaaS 巨头提供"现成模型层"¶
- 中间层不需要自己训模型 / 自己买卡 / 自己跑推理服务
- 可专注 Agent 工程 / 工具链 / 行业垂直
- 多模型适配从"成本"变成"差异化"——多家 MaaS 路由能力 = 中间层独有
负向:MaaS 巨头有动机往上吞应用层(platform-layer-collapse 同源)¶
- 火山如果向上做 Agent 平台 / 阿里 ATH "悟空"做 B 端 AI 原生工作平台 = 直接挤压 Sentino 这种中间层 Agent 平台的客户
- 与 google-agent-platform Google AP 18 组件全栈内化是同源威胁,中国版本由阿里 ATH 主导
结构性差异:中国 MaaS 巨头比 Google / Anthropic 多一层挤压能力 —— 它们也是云厂商(火山 = 字节云 + 阿里云 + 百度智能云)。Google AP 是"模型公司向云延伸",中国 ATH 是"云公司 + 模型公司天然合一"——中间层处境理论上更紧。
与 Sentino 的具体含义¶
Sentino IoT 设备 + Agent 平台是 MaaS 市场的用户(调用 LLM API),不是供应商。火山的 49.5% 第一对 Sentino 的具体含义:
- 多模型路由是 Sentino 的中间层生存条件 —— 与 sentino-memex 不变量第 1 条(不绑 LLM 厂商)+ google-agent-platform Model Garden 同方向。火山一家独大不是 Sentino 直接利好——客户被火山锁定时 Sentino 的"接火山豆包能力"反而是合规对接负担
- 客户问"用什么模型"时火山是不可绕过的回答 —— Sentino 销售材料应明示"多模型路由(含豆包 / 通义 / Claude / GPT)"作为差异化
- 2026 进入 token 账单百万到千万规模时成本敏感度上升 —— Sentino Agent 平台的 cache 优化 / workflow 优先 / token 控制能力(参见 amphiflow-pattern / harness-engineering)从"工程优雅"变"客户硬需求"
- 阿里悟空 B 端 AI 原生工作平台是潜在挤压源 —— 与 Sentino Agent 平台位于同一抽象层,但规模和资源完全不同。Sentino 差异化来自 IP 排他性 / 玩偶情感锚定 / 多模型路由 / 私有部署灵活度,不来自"做更好的 Agent 平台"
与已有 wiki 的对位关系¶
| 已有页面 | 对位关系 |
|---|---|
| platform-layer-collapse | 中国 MaaS 头部聚合是平台层坍缩在中国市场的具体形态——云公司 + 模型公司天然合一让坍缩更彻底 |
| google-agent-platform | 阿里 ATH "Token 三阶段"是 Google AP 4 pillars 的中国对照——同方向不同切分轴 |
| anthropic-openai-pe-jv-2026-05 | 美国走 PE-anchored 渠道收编 + 中国走 MaaS 头部聚合——两条 mid-market 整合路径,中国走资源整合 + 美国走资本整合 |
| individual-vs-institutional-ai | 火山引擎"150 万企业和个人"+ "140 家企业累计 Token > 1 万亿"是组织 AI 落地的中国规模数据 |
| ai-adoption-landscape-2026 | Stanford AI Index 是全球数据,本页是中国 MaaS 数据——相互补充的双重视角 |
| amphiflow-pattern | "省 token"工程能力(workflow 优先 + agent 兜底)在 token 账单百万到千万规模时价值上升 |
| harness-engineering | Cache 经济学 / prompt cache hit rate 是中间层在 token 价格下行环境的差异化能力 |
| naming-shapes-thinking | 阿里 ATH "Token 是未来的电"是命名塑造行业框架的具体案例 |
| ai-economy-vs-human-economy | MaaS 规模化是 AI 主导经济体的基础设施层(每元 token 量提升让更多任务从人转向 agent) |
| model-hardware-decoupling | DeepSeek V4 跨 NVIDIA + Ascend 双栈是模型侧解耦,本页 MaaS 是模型 → 应用层中间的市场化解耦 |
适用边界¶
- 本页是市场结构事实页,不做投资判断 / 客户选型推荐——具体厂商优劣需结合客户场景独立评估
- 数据口径都是"对外销售" —— 不含字节抖音 / 阿里电商 / 百度搜索等内部业务调用,所以是 ToB 市场口径,不是"中国 AI 总量"口径
- 池建强原文带客户立场(墨问西东是火山引擎企业客户)——本页采用 IDC 数据但不引用作者主张作为客观判断;"火山飞轮"等客户视角解读不进入本页
- 2026 IDC 预测的偏差风险 —— 当前曲线外推合理,但若发生(a)字节 / 阿里大幅价格战 / (b)OpenAI / Anthropic / Google 中国版本回归 / (c)私有化部署赛道反扑 / (d)开源 frontier 模型本地部署成本足够低 → 公有云 MaaS 增速可能不及预期
待观察¶
- 2026-H1 / 2026 全年 IDC 报告 —— 验证 40000 万亿预测是否兑现 / 火山份额是继续扩大还是被阿里 ATH 反扑
- 阿里 ATH 实际效果 —— 周畅 / 林俊旸 / 郁博文连续流失是否被 ATH 整合补回
- 单 Token 价格走势 —— "调用量 20 倍 + 营收 6 倍"意味着单价跌 70%,价格战是否会让 MaaS 厂商利润率被压扁
- 私有化部署赛道是否反扑公有云 —— 国企 / 金融 / 政府 AI 数据主权要求是否让私有化重新加速
- 阿里悟空 B 端 AI 原生工作平台的实际产品化时间表 —— 影响 Sentino 等中间层 Agent 平台的竞争格局
- 火山引擎 / 阿里云 / 百度智能云对中间层(如 Sentino)的正式合作政策——是否有 ISV / Marketplace / Revenue Share 计划
相关概念¶
- platform-layer-collapse — 中国 MaaS 头部聚合是平台层坍缩在中国市场的具体形态
- google-agent-platform — 美国对位框架(4 pillars × 18 组件 vs Token 三阶段)
- anthropic-openai-pe-jv-2026-05 — 美国走 PE 渠道整合 vs 中国走 MaaS 资源整合
- individual-vs-institutional-ai — 火山 150 万企业 + 140 家累计万亿是组织 AI 落地的中国规模数据
- ai-adoption-landscape-2026 — Stanford AI Index 全球数据 + 本页中国 MaaS 数据相互补充
- amphiflow-pattern — "省 token"工程能力在 token 账单规模化时价值上升
- harness-engineering — Cache 经济学是中间层在 token 价格下行环境的差异化能力
- naming-shapes-thinking — 阿里 ATH "Token 是未来的电" 是命名塑造行业框架的案例
- ai-economy-vs-human-economy — MaaS 规模化是 AI 主导经济体的基础设施层
- model-hardware-decoupling — DeepSeek V4 模型侧解耦 + 本页 MaaS 市场化解耦是同源不同层的解耦
- ai-agent-moats — Token 价格下行让"按 API 调用计费"模式更难差异化,成果定价 / 席位+托管的转向加速
- sentino-agent — Sentino 在三阶段中位于"应用层",与阿里悟空位于同一层但规模差量级