平台层坍缩

tags: [AI, 平台, 战略, 竞争, 架构]
created: 2026-04-13
updated: 2026-05-08
sources: [raw/notes/ai-coding-stack-layer-collapse-2026.md, raw/notes/huxuan-vibe-coding-games-2026.md, raw/notes/founder-park-creao-organizational-pivot-2026.md, raw/notes/deepseek-v4-release-2026-04.md, raw/notes/zhao-saipo-work-experience-ai-skill-2026-04-27.md, raw/notes/google-agent-platform-research-2026-04-28.md, raw/notes/anthropic-openai-pe-jv-fde-mid-market-2026-05-04.md, raw/notes/unitree-unistore-humanoid-app-store-2026-05-07.md, raw/notes/chijianqiang-idc-maas-token-economy-2026-05-08.md]

定义¶

平台层坍缩（Layer Collapse）是指模型厂商系统性地打穿传统软件栈分层，将原本属于上层应用的能力内化到模型与 Agent 执行体系中，导致中间层平台失去独立存在的必要性。

传统分层：模型层（LLM API）→ 应用构建层（Lovable / Base44 / Bolt）→ 具体应用

坍缩后：模型本身成为可以构建、运行并持续演化应用的系统，中间层被压缩为纯 UI 封装。

三重吞噬机制¶

层级	吞噬方向	手段	效果
模型层	向上吞噬应用逻辑	Tool use、Agent 编排	应用生成、组件拼装被迁移到更低层
执行层	向上吞噬运行环境	Computer use	AI 直接操作 OS/浏览器/现有软件，不依赖中间层抽象
Agent 层	向上吞噬开发流程	多智能体协作	规划→生成→评估→维护全流程自动化

当三件事同时发生，原本位于中间的"AI 应用构建平台"既不掌握更底层的执行能力，也无法提供比 Agent 更高层的抽象，只能停留在界面封装层——而这在技术上是最容易被替代的部分。

Anthropic 案例：从模型公司到应用平台¶

Anthropic 的产品栈演进是层级坍缩的典型路径：

Claude 模型 → Claude Code (CLI Agent) → Claude Cowork (GUI) → Computer Use → Multi-agent Framework

Claude Code（2025）：51 万行 TypeScript，具备文件编辑、命令执行、Git 操作、任务编排的完整开发流程能力（见 harness-engineering）
KAIROS（泄露）：常驻后台 Agent，空闲时执行内存整合——从"响应请求"到"持续运行"
ULTRAPLAN（泄露）：复杂规划任务卸载到云端——从"单次交互"到"长期任务管理"
Computer Use：绕过 API，直接操作 OS 和真实软件环境——打破传统 SaaS 边界
全栈 Vibe Coding 平台（2026-04 泄露）：文本构建应用 + 实时预览 + 一键部署 + 数据库/认证/分析内置

关键转变不是"做一个更强的 builder"，而是构建持续运行的 Agent 计算模型——能不断迭代、维护、重构软件的系统 vs 一次性生成工具。

其他厂商的类似路径¶

Google：Gemini 3 → Antigravity IDE（2025-11）→ 2026-04-22 Cloud Next：Vertex AI 整体改名 Gemini Enterprise Agent Platform，4 pillars × 18 组件全栈内化（详见下方"Google Agent Platform 实证"段）
OpenAI：Codex → VS Code 一键集成
Amazon：Kiro AI IDE
Replit：全面转向 AI Agent 模式

所有模型巨头都在向全栈构建工具转型，趋势是融合，不是分层。

Google Agent Platform 实证：18 组件单平台内化（2026-04-22）¶

Google Gemini Enterprise Agent Platform（2026-04-22 Cloud Next 公布，由 Vertex AI 改名而来）是平台层坍缩最强单一实证——把整套 agent 开发/运行/治理/优化基础设施 18 个组件内化进单一平台：

Pillar	内化组件（部分举例）
Build	Agent Studio（低代码）/ ADK（代码优先 + 2026 graph-based 子 agent 网络升级）/ Agent Garden（预构建模板）
Scale	Agent Runtime / Memory Bank / Memory Profiles / Agent Sandbox / Agent Sessions
Govern	Agent Identity（SPIFFE+X.509+mTLS+DPoP）/ Agent Registry / Agent Gateway / Model Armor / Anomaly+Threat Detection
Optimize	Agent Simulation / Evaluation / Observability / Optimizer

为什么这是"最强单一证据"：

跨度完整：从 build 到 optimize 全栈覆盖，而不是单点工具——之前的坍缩证据（Anthropic Claude Code → Cowork → Computer Use）是按时间线分段推进，Google AP 是一次性宣布全栈
官方表述明确终止 Vertex AI 独立形态："all Vertex AI services and roadmap evolutions will be delivered exclusively through the Agent Platform, rather than as a standalone service"——不是 rebrand，是终止上层独立产品
第三方 agent infra 公司空间被压缩：每个 18 个组件之前都对应至少一家初创公司的核心产品（Memory: mem0 / Eval: LangSmith / Observability: Langfuse / Identity: SPIFFE 厂商 / Registry: 工具市场公司）——单平台内化等于"模型公司一次性吃掉一整代 agent infra 创业公司"
配套 TPU 8t/8i + Anthropic 3.5 GW anchor：硬件+模型+平台+治理+分发全栈垂直整合，是模型层往上吞最完整的产品形态

与 Anthropic Claude Code 路径的对比：

维度	Anthropic Claude Code → Cowork	Google Agent Platform
推进方式	时间线分段（每季度新产品）	一次性宣布 18 组件
边界	Creator 类（写代码 / 写文档 / 创建内容）为主	4 pillars 全覆盖（含 Govern + Optimize）
治理	弱（Anthropic 主要靠 Safety Guardrails）	Govern 柱专门 7 组件
全栈	模型 + 应用	模型 + 应用 + 治理 + 优化 + 硬件 + 数据

对中间层 agent infra 公司的具体含义：

单组件创业公司（如纯 agent observability、纯 agent identity 提供商）面临结构性挤压
多组件 + 垂直深度 + 客户私有数据的中间层（如 palantir-ontology / Walmart 自建 super agents）相对安全
"中间层做 SaaS 替代品"路径（Sentino sentino-agent / RootSwarm 等）需要靠 agent-creator-refiner-operator 2+3 战略 + 三道护城河对冲

与 agent-creator-refiner-operator 的连接：Google AP 是 Creator + Refiner 平台典型实例，但不直接做 Operator——Garden 模板 + ADK 让企业自己造 Operator。这与三元论"Creator 是模型公司必吃赛道"判断完全一致——Google 把 Build 柱内化（Creator 工具），把 Operator 留给客户/合作方实现（让 ServiceNow / Salesforce 这种企业系统供应商接 A2A 协议）。

"生态降维打击"¶

"模型厂商每前进一步，留给中间层创业者的空气就稀薄一分。"

Vibe Coding 平台（Lovable、Bolt、Base44）的核心困境：

技术上：本质是对 GPT 5.1、Claude 4.5、Gemini 3 Pro 的高级封装
时间窗口：抓住了模型厂商"只管大脑、不顾手脚"的早期窗口，但窗口正在关闭
护城河脆弱：四道防线（市场错位 / UGC 生态 / 企业嵌入 / 品牌势能）均面临结构性挑战（见 ai-agent-moats）
Base44 已被 Wix 以 $80M 收购——创业公司开始寻求退出而非独立发展

90% 的传统编程技能正在被商品化，剩下 10%（如何协调 AI 进行复杂架构设计）价值翻 1000 倍——但这 10% 不取决于你用哪个 UI 包装器。

对 Sentino 的启示¶

层级坍缩的教训：不要做模型能力的"高级封装"。Sentino 的核心战略——粉丝经济 AI 陪伴变现（见 sentino）——恰好处于坍缩区之外：

	坍缩区（被吞噬）	Sentino 的价值链（安全）
技术层	通用 LLM 路由、TTS 调度、工作流编排	IP 授权关系（排他性）
产品层	UI 封装、应用模板、一键部署	实体玩偶（情感锚定物）
分发层	开发者工具市场	粉丝社区自传播
人格层	通用对话	与 IP 方深度配合的角色设计

模型厂商能提供 AI 大脑，但无法提供 Jisoo 的 IP、Shumon 玩偶的情感锚定、BLINK 粉丝社区的分发力。这是 parasocial-monetization IP 授权型变现的结构性优势。

反向窗口：小创业公司效率比大公司高 100-1000 倍¶

CREAO CEO 程凯在 2026-04 Founder Park 访谈给"层级坍缩"加了一个反向窗口论点——层级坍缩对模型层 / SaaS 层有效，但创业公司组织灵活度本身是中间层之外的存活窗口：

"今天创业公司最大的机会是你比大公司都简单。如果你的效率是所有同行竞争对手的 100 倍到 1000 倍，你基本上死不了——别人一个月发一个功能你一个月发 1000 个，堆都可以堆死他。"

"这个效率从哪来 = 纯粹的 AI 驱动公司。大公司做不到——改造几千几万人组织让他们接受 AI 分配工作 + 接受很多岗位被替代几乎不可能；但创业公司可以从一开始就这样建。"

含义： - 层级坍缩在中间层（如 vibe coding 工具 / 通用 SaaS）压力很大，但组织级 AI-first 能力是模型厂商也吞噬不了的——因为模型厂商自身是几千上万人组织，无法 AI-first 化 - 20 人级 AI 创业 + 95% AI 化 + 每天 8 次部署 = 模型厂商也跟不上的迭代速度 - 这是 Sentino 这种 20 人创业公司的窗口期——不在"做更好的模型 / 工具"上比拼，而在"组织 AI-first 化的速度"上比拼

与 pivot-speed-as-moat 的关系：组织效率是 pivot 速度的内在条件，pivot 速度是组织效率的外在表现。两者一起构成层级坍缩中"创业公司可活的窗口"。

对 sentino 的直接含义： - Sentino 当前的中间层位置（在 IP 方 / 模型厂商 / 客户之间）有被坍缩压力，但 Sentino 的组织灵活度是结构性优势——20 人能 pivot，YG / Sanrio / OpenAI / 大客户都不能 - 但这个优势能不能兑现取决于 Sentino 自己是不是 95% AI-first——如果 Sentino 内部还是传统创业流程 + 几个 AI 工具，这个窗口期就不属于 Sentino - 自检题：Sentino 工程 / 产品 / 客户支持 / 销售四个职能里 AI 化比例分别是多少？哪个职能拖低了整体 pivot 速度？

反向制约：分发与平台审核拖累 vibe coding 平台¶

腾讯研究院 2026-04 vibe coding 长文（→ vibe-coding-creator-motives）观察到 vibe coding 平台不只面临模型厂商坍缩压力，还面临传统应用分发渠道的反向制约：

App Store 政策反弹：以"绕过审核机制的动态代码执行"为由下架或冻结了多个 vibe coding 工具的 iOS 版本——把 AI 实时构建/运行视为违反 4.7 条
审核排队拉长：2025 年 12 月 App Store 应用提交量同比增长 56%，审核时间拉长到数周
微信小程序合规：备案 5-10 个工作日 + 防沉迷 SDK + 隐私政策 + 个人主体须先注册个体工商户

这给"平台层坍缩"加了一个反向论点：模型厂商可以吃掉 Vibe Coding 平台（如 Lovable / Bolt 的 UI 封装价值），但分发平台（Apple / 微信 / Google）才是最终的"层级守门员"——它们既不是模型厂商也不是中间层平台，而是用户触达渠道，掌握着合规审核与上架权。

层级坍缩在中间层（应用构建工具）发生很快，在分发层短期内不会发生（合规、审核、备案、抽成机制是政策与商业并存的护城河）。Vibe coding 出口的瓶颈正在从"代码生成能力"转移到"上架合规"——这条最后一公里 AI 短期内解决不了。

反向力量：开源模型追平闭源（2026-04 DeepSeek V4）¶

层级坍缩的核心动力是模型厂商利用模型能力优势往上吞应用层。这条动力在模型层"闭源 vs 开源"维度有一个反向力量：

deepseek-v4 在多个 benchmark 上逼平闭源 frontier（SWE-Verified 80.6% vs Opus 4.6 80.8% / Codeforces 3206 超过 GPT-5.4 3168）+ Apache 2.0 开源 + 跨 NVIDIA/Ascend 双栈解耦——这削弱了"必须用闭源 frontier 模型才能做严肃应用"的前提。

含义：

中间层 SaaS / 应用构建工具如果能 OEM 切换到开源 frontier，就能部分对冲被闭源模型厂商坍缩的压力——只要开源模型能力跟得上
开源模型本身没有动机往上吞应用层（不是产品公司，不变现应用）——结构上不会重演 Anthropic 的 Claude → Claude Code → Cowork → Computer Use 路径
但中间层切换到开源仍受三条限定（参见 model-hardware-decoupling）：开源工具链仍主要 CUDA / 国产硬件批量上市未发生 / 长上下文检索开源仍落后 ~10 分

engram-conditional-memory 揭示的"模型架构内部往下分层"是另一条反向方向——模型层主体地位上升不仅表现为往上吞，还表现为内部结构精细化（hash 表 + dense + MoE 三种 primitive 共存）。

三条方向（往上吞 / 往下扩散到多家硬件 / 内部分层）共同构成 2026 模型层的全方位主导，但开源 frontier 的存在让中间层至少保留了"切换 backend"的对冲选项。

新坍缩工具：上游撤 OAuth piggyback（2026-04 OpenClaw 案例）¶

层级坍缩的工具集此前主要是"出新产品吃中间层"（Anthropic Claude Code → Cowork → Computer Use 路径）。2026-04 Anthropic 撤销第三方 agentic 工具走 Claude subscription OAuth 的能力给坍缩加了第二种工具——直接通过 OAuth/API access 控制切断中间层的经济基础。

事件事实（WebSearch 2026-04-27 核实）¶

2026-02-20：Anthropic 法律条款明确禁止 subscription OAuth tokens 用于第三方工具
2026-02～03：服务端静默部署 OAuth token 拦截
2026-04-04 12:00 PT：政策正式执行——Claude Free/Pro/Max 订阅不再覆盖第三方 agentic 工具
范围：Boris Cherny（Head of Claude Code）X 表态："applies to all third-party harnesses and will be rolled out to more shortly"——不是单点针对 OpenClaw，是跨所有第三方 harness 的全面策略
补偿：一次性 credits = monthly fee + 30% pre-purchase 折扣

经济学：cross-subsidy 的不可持续¶

单个 OpenClaw instance 一天可消耗 $1,000–$5,000 API 等价
$200/月 Max 订阅 ≈ 5–10x 套利空间
政策执行时约 135,000 个 OpenClaw instances 在跑——不是边缘小众，是规模级
Anthropic 第一方工具（Claude Code / Cowork）专门优化 prompt cache hit rate，第三方工具绕过缓存 → 第三方算力成本对 Anthropic 不可持续

→ 与 harness-engineering "Cache 经济学是架构约束"判断的具体实证：第一方相对第三方的 cache 优势不只是工程优化，是结构性成本差——这条差异化决定了上游有动机在政策上切断 piggyback

不是 Anthropic 个案：行业级 pattern¶

Google 2026-02 已先行同样政策：Antigravity / Gemini CLI / Gemini Code Assist 同样禁止第三方 OAuth piggyback。Jack Wotherspoon (Gemini CLI DR)：piggyback OAuth 是"direct violation of applicable terms and policies"。

→ 不是"模型厂商个别动作"，是从 flat-rate 订阅向 usage-based 计费的全行业转向——AI workload 成熟到一定规模后 cross-subsidy 模式不可持续，所有上游都会向同一方向走

对中间层 agent 框架的含义¶

OpenClaw 框架本身没停服——用户自带 API key 走 pay-as-you-go 即可继续用
但中间层平台失去了"用户用 $200 拿 $1000-5000 价值"的隐性补贴——这等于给中间层抬了一个数量级的价格门槛
之前靠"订阅价比 API 便宜"建立用户基数的中间层平台需要重定价或换模式
amphiflow-pattern "workflow 优先 + agent 兜底"等省 token 架构在新定价环境下价值上升——异常路径走 agent 之外大部分调用走 workflow，对 token 成本敏感的中间层多了一个生存策略

对 Sentino 的具体含义¶

Sentino 当前向客户卖 Standalone Agent（sentino-agent）—— Sentino 自己处于"上游模型 + 下游客户"之间的中间层位置。这个事件的含义： - 如果 Sentino 用 Anthropic API 服务客户，Sentino 是直接付 API 客户，不在 OAuth piggyback 范围内——不直接受影响 - 但这个事件证明上游对中间层的政策权力——上游可以随时调整定价 / 限制使用方式 / 优先自家产品。Sentino 长期不能假设上游 API 价格 / 政策稳定 - 与 model-hardware-decoupling 的连接：上游政策风险是 hedge multi-vendor 的具体动机——保留切换到开源模型 / 多家 LLM 的能力对中间层是结构性安全保障

坍缩在分销层的延伸：PE-anchored FDE JV（2026-05-04）¶

Anthropic / OpenAI 同日宣布 PE-anchored FDE JV（2026-05-04）把平台层坍缩从软件中间层延伸到分销渠道层 + 部署服务层——之前模型公司直接吞应用层（Claude Code / Cowork / Computer Use / Google Agent Platform），现在通过 JV 把 mid-market 分销渠道 + FDE 部署服务一并拿下。

坍缩链路新增 2 层：

Before（2026-04 之前坍缩链路）：
模型 → 应用层 → 客户

Now（2026-05-04 之后扩展链路）：
模型 → 应用层 → 分销渠道层（PE 财团）→ 部署服务层（FDE JV）→ 客户 EBITDA

结构性威胁对象扩展：

之前坍缩威胁的中间层	2026-05-04 扩展后新增威胁对象
Vibe Coding 平台 / 通用 agent 框架	+ 传统咨询公司（Accenture / Deloitte / McKinsey 数字化业务）—— Fortune 5-04 标题直接说 "Anthropic takes shot at consulting industry"
应用层 SaaS / 通用 IDE 套壳	+ mid-market 独立销售公司 / 区域 IT 集成商 —— PE-anchored JV 给 PE 阵营 portco 优先销售权，独立销售难以竞争几周级 procurement 压缩

关键差异化：之前坍缩是 frontier 模型公司自己出产品吃应用层；2026-05-04 坍缩是 frontier 模型公司通过独立 JV 实体吃分销层 + 部署服务层（详见 IPO 估值双轨结构解释为什么用 JV 而非 in-house）——同样是吞噬，但法律主体不同 + 财务报表不同 + Liability Wall 的责任归属不同。

含义：

坍缩的工具集从单纯"出产品 / 撤 OAuth piggyback"扩到"PE 渠道战略合作"——上游可用工具更多元
中间层 agent 应用要躲开坍缩，不只要躲开"被模型公司产品吞"，还要躲开"被 JV 部署服务吞"——双线压力
但JV 模式只覆盖 PE-owned portco 子集 —— 全市场仍有大量非 PE-owned 中型企业 / 消费者市场不在这个渠道辐射内（详见 pe-anchored-ai-distribution 全市场天花板段），给独立中间层留了一片可达市场

中国版本：MaaS 头部聚合 + 云公司天然合一（2026-05 IDC 报告）¶

中国市场的层级坍缩有一个结构性差异化路径——MaaS 巨头同时是云厂商，模型层 + 平台层 + 算力层 + 销售层天然合一，挤压中间层比 Google AP / Anthropic 还更彻底。

IDC 2026-05-07 报告的核心数据：

2025 年中国公有云大模型调用量 1944 万亿 Tokens（同比 16 倍）+ 营收 30.7 亿元
火山引擎 49.5% 中国第一（按调用量），份额从 2024 年 46.4% → 2025H1 49.2% → 2025 年 49.5% 持续扩大
2026 IDC 预测 40000 万亿 Tokens（再增 20 倍）+ 营收 186 亿元
阿里 2026-03-16 成立 Alibaba Token Hub（ATH）事业群，CEO 吴泳铭直接管辖，整合通义实验室 / 百炼 MaaS / 千问 / 悟空（B 端 AI 原生工作平台） / AI 创新事业部 5 大板块——是阿里近年规模最大的 AI 组织整合

关键差异：与 Google AP / Anthropic 的挤压模式不同：

维度	Google AP / Anthropic	中国 MaaS（火山 / ATH）
起点	模型公司向云延伸	云公司 + 模型公司天然合一
平台层抽象	4 pillars × 18 components（Agent 平台抽象）	Token 三阶段（创造 / 输送 / 应用，Token 经济抽象）
治理层	Google Govern 三件套（独立柱）	中国版本暂未独立——Govern 是缺口
中间层挤压力	模型公司主导，云能力是补	同一主体既卖云资源 + 卖模型 + 卖 Agent 平台 + 卖企业 SaaS（如悟空）—— 中间层只能在它们没覆盖的细分活

对中间层 Agent 平台的具体含义：

中国 MaaS 巨头的"平台层坍缩"理论上比 Google AP 更彻底——同一主体既是云供应商 + 模型供应商 + Agent 平台 + 企业 SaaS（钉钉 / 悟空）
但实际可达市场仍受限：客户对供应商集中度的反感 + 国企 / 金融 / 政府数据主权要求 / 多模型路由偏好 = 给中间层留下不被坍缩的 niche
与 Sentino sentino-agent 的具体对照：Sentino 不与火山 / 阿里悟空在 mid-market B 端 SaaS 赛道正面竞争——Sentino 的差异化来自 IP 排他性 + 玩偶情感锚定 + 多模型路由 + 私有部署灵活度（详见上方"对 Sentino 的启示"段已有论述）

与 anthropic-openai-pe-jv-2026-05 的对照 —— 美国走 PE-anchored 渠道收编（资本整合）+ 中国走 MaaS 头部聚合（资源整合），两条 mid-market AI 部署路径在 2026-05 同期发生，反映"全球 AI 行业进入中间层结构性挤压期"，方法不同但方向一致。

反向运动：硬件 OEM 主动建中间层（2026-05 宇树 UniStore）¶

层级坍缩在软件主导赛道（vibe coding / agent 框架 / SaaS）压力极大，但在硬件主导赛道有反向运动——硬件 OEM 主动构建中间层 而非被吞。

宇树科技 2026-05-07 全面开放 UniStore 平台（详见 embodied-robot-app-store-pattern）是首例公开实证：

方向	样本	谁在吃中间层	谁被吃
正向坍缩（本页主线）	Anthropic Claude Code / Google Agent Platform	模型公司向上吞应用层	mem0 / LangSmith / Lovable / Bolt 等中间层创业公司
反向运动	宇树 UniStore	硬件公司向上建中间层	第三方机器人开发者直接面向裸 SDK 的可能性

两者逻辑差异：

模型公司坍缩中间层是因为模型能力本身让中间层抽象变薄——写代码不需要 IDE 抽象、agent 不需要 workflow 抽象、应用不需要 vibe coding UI 封装
硬件公司建中间层是因为硬件本身没有"自动消解中间层" 能力——机器人能跑能跳但不会自动写自己的应用，反而 OEM 需要主动构造一层让开发者能填进来

含义：层级坍缩不是普遍法则，是模型能力优势的具体表现。在硬件主导赛道（机器人 / 物联网设备 / 嵌入式），中间层不会自动消失，OEM 反而有动机主动构建——这是硬件 OEM 在 AI 时代的特有战略空间。

对 sentino 的间接含义：Sentino 处在 IoT 硬件 + Agent 平台双层中间，与宇树形态相似但杠杆不同（宇树用硬件出货量换议价权 / Sentino 用 IP 授权排他性 + Agent 工程深度换议价权）。两条路径都验证了"硬件主导赛道里，中间层有结构性存活空间"——给 sentino-agent 主战略叙事加一个反向坍缩样本。

反向力量：过程数据是不可坍缩的 substrate¶

赵赛坡 2026-04 评论文章给坍缩论加了第三个反向力量——单纯 agent 外壳确实会被坍缩，但行业过程数据不会：

模型可以调用，界面可以模仿，真正稀缺的是行业里的真实工作记录：谁有权限，谁能确认，哪些步骤可以跳过，异常出现时谁来决定。这些东西不在产品介绍里，通常藏在工单、群聊、会议纪要和老员工的习惯里。

含义： - 模型厂商可以坍掉 vibe coding 的 UI 层，但拿不到客户公司内部的过程数据 - 这是 process-data-vs-output-data 视角对 ai-agent-moats "垂直专精"的具体支撑——专精的载体是过程数据，不是 UI - 由此预测的新公司类型（"流程改造、数据清洗、隐私合规、行业 skill 库、企业 AI 治理"）正是模型厂商难以伸手的领域

定义¶