🏠 home › concepts › china-maas-market-2026
tags
[AI, 云, MaaS, 中国, 市场结构, Token 经济, 火山引擎, 阿里, 行业格局]
created
2026-05-08
updated
2026-05-08
sources
[raw/notes/chijianqiang-idc-maas-token-economy-2026-05-08.md]

定义

MaaS = Model as a Service:企业通过公有云平台调用大模型能力,按调用次数 / Token 使用量计费,无需自己维护模型部署 / 硬件资源 / 模型迭代。是云计算市场在 AI 时代衍生出的新细分形态——竞争不再以"资源 + 产品矩阵"为轴,而以"模型 token 调用规模 + 工具链 + 生态"为轴。

本页基于 IDC 2026-05-07 发布的《中国公有云大模型调用量市场分析报告》整理 2025–2026 中国 MaaS 市场的核心结构性事实与行业判断。

IDC 核心数据(2026-05-07 报告)

2025 年实际

维度 数字 同比
中国公有云大模型调用量 1944 万亿 Tokens 16 倍(2024 年 = 114 万亿,不是 16%
中国公有云 MaaS 市场营收 30.7 亿元人民币
火山引擎份额(按调用量) 49.5% 中国第一 2024 年 46.4% → 2025H1 49.2% → 2025 年 49.5%,份额持续扩大
日均消耗变化 2025-01 ~1.6 万亿 → 2025-12 月底 9.6 万亿 单年 6 倍

统计口径:各大云厂商对外部客户(个人 + 企业)的大模型公有云服务调用量(含 Token Plan 订阅 + API 服务)。不含厂商自有业务调用 —— 即火山数据不含抖音、豆包、即梦等字节系内部产品,是真实对外销售口径。

2026 年 IDC 预测

维度 预测 同比
Token 消耗 40000 万亿次 较 2025 增长约 20 倍
营收 186 亿元人民币 较 2025 增长约 6 倍

预测保守性观察:日均 1.6→9.6 万亿(一年 6 倍)月环比 ~17%,按此持续 12 个月即可达成 2026 IDC 预测——不是预测未来突破,是已发生增速的简单外推

市场格局(按调用量 / 按营收两套排名)

口径 1 2 3 4 5
按调用量(公有云 MaaS) 火山引擎 49.5% 阿里云 百度智能云 硅基流动 移动云
按营收 火山引擎 40%+ 阿里云 百度智能云 智谱 移动云
私有化部署(独立赛道) 百度智能云 商汤 电信 AI 中关村科金 创新奇智 / 星环 / 中国电子云

关键观察: - 公有云 + 私有化部署是完全不同的格局——私有化以政府 / 国企 / 金融大单为主,火山几乎不参与 - 智谱按营收进入前 5 但按调用量没有——反映 ToB 高单价模型 vs ToC 高调用量模型的两条路径 - 硅基流动作为聚合平台型公司排第 4 是 2025 年新现象(详见 platform-layer-collapse 中间层路径)

应用场景分布(公有云 MaaS)

主要应用群体集中在 4 个赛道: - 泛互联网(游戏 / 娱乐 / 教育) - 智能办公 - 智能硬件(汽车 / 手机 / 智能眼镜) - 大消费

私有化部署主要集中在智能办公 / 数据处理与分析 / 市场营销

阶段性转折:从文本生成到多模态 + Agent

IDC 对 2025 年 MaaS 的定位是"经历了从试点到规模化应用的关键转折"。具体形态是 Token 消耗结构从"文本"切换到"多模态 + Agent":

阶段 单次任务 Token 消耗 实际增量含义
文本对话 / 文本生成 几千~几万 token 个体使用率高但单次低
Coding 任务 一个编程指令 200 万 token 量级 Agent 类应用规模化标志
视频生成 720p 15s 视频 ≈ 100 万 token(Seedance 2.0 量级,未独立核实) 多模态成熟

含义:调用量爆增不只是用户数增长,而是单次任务消耗指数级提升——长上下文 / Agent 长跑 / 多模态全部撕开 token 单次消耗。

阿里 Alibaba Token Hub(ATH):Token 三阶段框架

2026-03-16 阿里成立 ATH 事业群,由 CEO 吴泳铭直接负责,与阿里云智能事业群 / 电商事业群平行。整合 5 大 AI 板块:通义实验室 / MaaS 业务线(百炼)/ 千问事业部 / 悟空事业部(首次亮相,B 端 AI 原生工作平台)/ AI 创新事业部。

Token 三阶段逻辑(吴泳铭版本):

创造(通义实验室)→ 输送(百炼 MaaS)→ 应用(千问 / 悟空 / 创新应用)
        ≈
发电厂      →    电网         →   各式用电终端(手机 / 电脑 / 家电 / 新能源汽车)

吴泳铭 2025-09 云栖大会主张:"Token 就是未来的电" —— "AI 将替代能源的地位,成为最重要的商品,绝大部分 AI 能力将以 Token 的形式在云计算网络上产生和输送。"

这是 Naming Shapes Thinking(naming-shapes-thinking)的具体应用 —— 把 Token 从"技术单位"重新命名为"经济商品",把 MaaS 平台位置类比为"电网"(基础设施 + 资源调度 + 计费)。

google-agent-platform 4 pillars 的对照

阿里 ATH 是中国版的"AI 全栈框架",与 Google Agent Platform 4 pillars 对位但视角不同:

维度 Google Agent Platform Alibaba Token Hub
切分轴 4 pillars(Build / Scale / Govern / Optimize) Token 生命周期(创造 / 输送 / 应用)
核心抽象 Agent 平台 Token 经济
Govern 处理 独立柱(Identity / Registry / Gateway 三件套) 未在三阶段中独立 —— 是阿里方案的明显差距
模型策略 Model Garden 200+ 模型开放 通义实验室主推 + 兼容第三方
客户层 Box / Workday / Salesforce / ServiceNow 原生集成 钉钉 7 亿用户 + 悟空 B 端工作流

两套框架共同的判断:在 Token 经济时代,云厂商的胜负不再只看模型质量,而看"模型 + 平台 + 工具链 + 客户分销"的全栈整合度。

阿里 ATH 的人才紧迫性背景

国产模型 Token 占比数据:受 OpenClaw 开源 AI 智能体热潮带动,2026-Q1 国产模型 Token 使用量占全球前十名模型总 Token 消耗的 61%——这是 ATH 战略时点的市场背景

影响大模型落地的前五因素(IDC 调研)

按 IDC 调研顺序:

  1. 模型性能 —— 排第一意味着 2026 仍是"模型还在升级"周期
  2. 安全合规 —— Govern 类需求开始进入选型主轴(与 google-agent-platform Govern 三件套同方向)
  3. 内容质量 —— 与模型性能相关但不同(输出可控性)
  4. 平台可用性 —— 即工具链 + 文档 + SDK + 集成度
  5. 成本效益 —— 当前排最后,但 IDC 主张"Token 消耗再增长 20 倍后,再小的单价差异都会被规模放大"

关键判断:成本因素当前排第 5 是因为总规模仍小(30.7 亿元),平均单客户 Token 账单还在万元到几十万元区间。当 2026 进入 186 亿元规模 + 单客户进入百万到千万 token 账单时,成本敏感度会从第 5 跃升到选型决策硬指标——这是 amphiflow-pattern / harness-engineering 等"省 token"工程能力价值上升的市场背景

单 Token 价格预期下降 ~70%

按 IDC 数据反推单 Token 价格走势:

调用量 营收 估算单价(元/万 token)
2025 1944 万亿 30.7 亿 ~0.0158
2026 预测 40000 万亿 186 亿 ~0.00465

从 2025 到 2026 单 Token 价格预期下降 ~70% —— 调用量增长 20 倍 + 营收只增长 6 倍 = 单价持续下行。

含义: - 价格战会让 MaaS 厂商利润率被压扁,赢家只能靠规模摊薄成本 - 客户从 MaaS 拿到的"每元 token 量"持续提升 —— 同样预算下能跑更复杂任务,给 Agent 类应用降本背书 - 中间层(如 sentino-agent)从 MaaS 转售 token 给最终客户的差价空间被压缩——只能靠工程能力(cache 优化 / 路由 / 工具链)创造增值

中间层的双重含义

MaaS 头部聚合给中间层 Agent 平台 / 应用层创业公司带来双重信号:

正向:MaaS 巨头提供"现成模型层"

负向:MaaS 巨头有动机往上吞应用层(platform-layer-collapse 同源)

结构性差异:中国 MaaS 巨头比 Google / Anthropic 多一层挤压能力 —— 它们也是云厂商(火山 = 字节云 + 阿里云 + 百度智能云)。Google AP 是"模型公司向云延伸",中国 ATH 是"云公司 + 模型公司天然合一"——中间层处境理论上更紧。

与 Sentino 的具体含义

Sentino IoT 设备 + Agent 平台是 MaaS 市场的用户(调用 LLM API),不是供应商。火山的 49.5% 第一对 Sentino 的具体含义:

  1. 多模型路由是 Sentino 的中间层生存条件 —— 与 sentino-memex 不变量第 1 条(不绑 LLM 厂商)+ google-agent-platform Model Garden 同方向。火山一家独大不是 Sentino 直接利好——客户被火山锁定时 Sentino 的"接火山豆包能力"反而是合规对接负担
  2. 客户问"用什么模型"时火山是不可绕过的回答 —— Sentino 销售材料应明示"多模型路由(含豆包 / 通义 / Claude / GPT)"作为差异化
  3. 2026 进入 token 账单百万到千万规模时成本敏感度上升 —— Sentino Agent 平台的 cache 优化 / workflow 优先 / token 控制能力(参见 amphiflow-pattern / harness-engineering)从"工程优雅"变"客户硬需求"
  4. 阿里悟空 B 端 AI 原生工作平台是潜在挤压源 —— 与 Sentino Agent 平台位于同一抽象层,但规模和资源完全不同。Sentino 差异化来自 IP 排他性 / 玩偶情感锚定 / 多模型路由 / 私有部署灵活度,不来自"做更好的 Agent 平台"

与已有 wiki 的对位关系

已有页面 对位关系
platform-layer-collapse 中国 MaaS 头部聚合是平台层坍缩在中国市场的具体形态——云公司 + 模型公司天然合一让坍缩更彻底
google-agent-platform 阿里 ATH "Token 三阶段"是 Google AP 4 pillars 的中国对照——同方向不同切分轴
anthropic-openai-pe-jv-2026-05 美国走 PE-anchored 渠道收编 + 中国走 MaaS 头部聚合——两条 mid-market 整合路径,中国走资源整合 + 美国走资本整合
individual-vs-institutional-ai 火山引擎"150 万企业和个人"+ "140 家企业累计 Token > 1 万亿"是组织 AI 落地的中国规模数据
ai-adoption-landscape-2026 Stanford AI Index 是全球数据,本页是中国 MaaS 数据——相互补充的双重视角
amphiflow-pattern "省 token"工程能力(workflow 优先 + agent 兜底)在 token 账单百万到千万规模时价值上升
harness-engineering Cache 经济学 / prompt cache hit rate 是中间层在 token 价格下行环境的差异化能力
naming-shapes-thinking 阿里 ATH "Token 是未来的电"是命名塑造行业框架的具体案例
ai-economy-vs-human-economy MaaS 规模化是 AI 主导经济体的基础设施层(每元 token 量提升让更多任务从人转向 agent)
model-hardware-decoupling DeepSeek V4 跨 NVIDIA + Ascend 双栈是模型侧解耦,本页 MaaS 是模型 → 应用层中间的市场化解耦

适用边界

待观察

相关概念