- tags
- [AI, 平台, 战略, 竞争, 架构]
- created
- 2026-04-13
- updated
- 2026-05-06
- sources
- [raw/notes/ai-coding-stack-layer-collapse-2026.md, raw/notes/huxuan-vibe-coding-games-2026.md, raw/notes/founder-park-creao-organizational-pivot-2026.md, raw/notes/deepseek-v4-release-2026-04.md, raw/notes/zhao-saipo-work-experience-ai-skill-2026-04-27.md, raw/notes/google-agent-platform-research-2026-04-28.md, raw/notes/anthropic-openai-pe-jv-fde-mid-market-2026-05-04.md]
定义¶
平台层坍缩(Layer Collapse)是指模型厂商系统性地打穿传统软件栈分层,将原本属于上层应用的能力内化到模型与 Agent 执行体系中,导致中间层平台失去独立存在的必要性。
传统分层:模型层(LLM API)→ 应用构建层(Lovable / Base44 / Bolt)→ 具体应用
坍缩后:模型本身成为可以构建、运行并持续演化应用的系统,中间层被压缩为纯 UI 封装。
三重吞噬机制¶
| 层级 | 吞噬方向 | 手段 | 效果 |
|---|---|---|---|
| 模型层 | 向上吞噬应用逻辑 | Tool use、Agent 编排 | 应用生成、组件拼装被迁移到更低层 |
| 执行层 | 向上吞噬运行环境 | Computer use | AI 直接操作 OS/浏览器/现有软件,不依赖中间层抽象 |
| Agent 层 | 向上吞噬开发流程 | 多智能体协作 | 规划→生成→评估→维护全流程自动化 |
当三件事同时发生,原本位于中间的"AI 应用构建平台"既不掌握更底层的执行能力,也无法提供比 Agent 更高层的抽象,只能停留在界面封装层——而这在技术上是最容易被替代的部分。
Anthropic 案例:从模型公司到应用平台¶
Anthropic 的产品栈演进是层级坍缩的典型路径:
Claude 模型 → Claude Code (CLI Agent) → Claude Cowork (GUI) → Computer Use → Multi-agent Framework
- Claude Code(2025):51 万行 TypeScript,具备文件编辑、命令执行、Git 操作、任务编排的完整开发流程能力(见 harness-engineering)
- KAIROS(泄露):常驻后台 Agent,空闲时执行内存整合——从"响应请求"到"持续运行"
- ULTRAPLAN(泄露):复杂规划任务卸载到云端——从"单次交互"到"长期任务管理"
- Computer Use:绕过 API,直接操作 OS 和真实软件环境——打破传统 SaaS 边界
- 全栈 Vibe Coding 平台(2026-04 泄露):文本构建应用 + 实时预览 + 一键部署 + 数据库/认证/分析内置
关键转变不是"做一个更强的 builder",而是构建持续运行的 Agent 计算模型——能不断迭代、维护、重构软件的系统 vs 一次性生成工具。
其他厂商的类似路径¶
- Google:Gemini 3 → Antigravity IDE(2025-11)→ 2026-04-22 Cloud Next:Vertex AI 整体改名 Gemini Enterprise Agent Platform,4 pillars × 18 组件全栈内化(详见下方"Google Agent Platform 实证"段)
- OpenAI:Codex → VS Code 一键集成
- Amazon:Kiro AI IDE
- Replit:全面转向 AI Agent 模式
所有模型巨头都在向全栈构建工具转型,趋势是融合,不是分层。
Google Agent Platform 实证:18 组件单平台内化(2026-04-22)¶
Google Gemini Enterprise Agent Platform(2026-04-22 Cloud Next 公布,由 Vertex AI 改名而来)是平台层坍缩最强单一实证——把整套 agent 开发/运行/治理/优化基础设施 18 个组件内化进单一平台:
| Pillar | 内化组件(部分举例) |
|---|---|
| Build | Agent Studio(低代码)/ ADK(代码优先 + 2026 graph-based 子 agent 网络升级)/ Agent Garden(预构建模板) |
| Scale | Agent Runtime / Memory Bank / Memory Profiles / Agent Sandbox / Agent Sessions |
| Govern | Agent Identity(SPIFFE+X.509+mTLS+DPoP)/ Agent Registry / Agent Gateway / Model Armor / Anomaly+Threat Detection |
| Optimize | Agent Simulation / Evaluation / Observability / Optimizer |
为什么这是"最强单一证据":
- 跨度完整:从 build 到 optimize 全栈覆盖,而不是单点工具——之前的坍缩证据(Anthropic Claude Code → Cowork → Computer Use)是按时间线分段推进,Google AP 是一次性宣布全栈
- 官方表述明确终止 Vertex AI 独立形态:"all Vertex AI services and roadmap evolutions will be delivered exclusively through the Agent Platform, rather than as a standalone service"——不是 rebrand,是终止上层独立产品
- 第三方 agent infra 公司空间被压缩:每个 18 个组件之前都对应至少一家初创公司的核心产品(Memory: mem0 / Eval: LangSmith / Observability: Langfuse / Identity: SPIFFE 厂商 / Registry: 工具市场公司)——单平台内化等于"模型公司一次性吃掉一整代 agent infra 创业公司"
- 配套 TPU 8t/8i + Anthropic 3.5 GW anchor:硬件+模型+平台+治理+分发全栈垂直整合,是模型层往上吞最完整的产品形态
与 Anthropic Claude Code 路径的对比:
| 维度 | Anthropic Claude Code → Cowork | Google Agent Platform |
|---|---|---|
| 推进方式 | 时间线分段(每季度新产品) | 一次性宣布 18 组件 |
| 边界 | Creator 类(写代码 / 写文档 / 创建内容)为主 | 4 pillars 全覆盖(含 Govern + Optimize) |
| 治理 | 弱(Anthropic 主要靠 Safety Guardrails) | Govern 柱专门 7 组件 |
| 全栈 | 模型 + 应用 | 模型 + 应用 + 治理 + 优化 + 硬件 + 数据 |
对中间层 agent infra 公司的具体含义:
- 单组件创业公司(如纯 agent observability、纯 agent identity 提供商)面临结构性挤压
- 多组件 + 垂直深度 + 客户私有数据的中间层(如 palantir-ontology / Walmart 自建 super agents)相对安全
- "中间层做 SaaS 替代品"路径(Sentino sentino-agent / RootSwarm 等)需要靠 agent-creator-refiner-operator 2+3 战略 + 三道护城河对冲
与 agent-creator-refiner-operator 的连接:Google AP 是 Creator + Refiner 平台典型实例,但不直接做 Operator——Garden 模板 + ADK 让企业自己造 Operator。这与三元论"Creator 是模型公司必吃赛道"判断完全一致——Google 把 Build 柱内化(Creator 工具),把 Operator 留给客户/合作方实现(让 ServiceNow / Salesforce 这种企业系统供应商接 A2A 协议)。
"生态降维打击"¶
"模型厂商每前进一步,留给中间层创业者的空气就稀薄一分。"
Vibe Coding 平台(Lovable、Bolt、Base44)的核心困境:
- 技术上:本质是对 GPT 5.1、Claude 4.5、Gemini 3 Pro 的高级封装
- 时间窗口:抓住了模型厂商"只管大脑、不顾手脚"的早期窗口,但窗口正在关闭
- 护城河脆弱:四道防线(市场错位 / UGC 生态 / 企业嵌入 / 品牌势能)均面临结构性挑战(见 ai-agent-moats)
- Base44 已被 Wix 以 $80M 收购——创业公司开始寻求退出而非独立发展
90% 的传统编程技能正在被商品化,剩下 10%(如何协调 AI 进行复杂架构设计)价值翻 1000 倍——但这 10% 不取决于你用哪个 UI 包装器。
对 Sentino 的启示¶
层级坍缩的教训:不要做模型能力的"高级封装"。Sentino 的核心战略——粉丝经济 AI 陪伴变现(见 sentino)——恰好处于坍缩区之外:
| 坍缩区(被吞噬) | Sentino 的价值链(安全) | |
|---|---|---|
| 技术层 | 通用 LLM 路由、TTS 调度、工作流编排 | IP 授权关系(排他性) |
| 产品层 | UI 封装、应用模板、一键部署 | 实体玩偶(情感锚定物) |
| 分发层 | 开发者工具市场 | 粉丝社区自传播 |
| 人格层 | 通用对话 | 与 IP 方深度配合的角色设计 |
模型厂商能提供 AI 大脑,但无法提供 Jisoo 的 IP、Shumon 玩偶的情感锚定、BLINK 粉丝社区的分发力。这是 parasocial-monetization IP 授权型变现的结构性优势。
反向窗口:小创业公司效率比大公司高 100-1000 倍¶
CREAO CEO 程凯在 2026-04 Founder Park 访谈给"层级坍缩"加了一个反向窗口论点——层级坍缩对模型层 / SaaS 层有效,但创业公司组织灵活度本身是中间层之外的存活窗口:
"今天创业公司最大的机会是你比大公司都简单。如果你的效率是所有同行竞争对手的 100 倍到 1000 倍,你基本上死不了——别人一个月发一个功能你一个月发 1000 个,堆都可以堆死他。"
"这个效率从哪来 = 纯粹的 AI 驱动公司。大公司做不到——改造几千几万人组织让他们接受 AI 分配工作 + 接受很多岗位被替代几乎不可能;但创业公司可以从一开始就这样建。"
含义: - 层级坍缩在中间层(如 vibe coding 工具 / 通用 SaaS)压力很大,但组织级 AI-first 能力是模型厂商也吞噬不了的——因为模型厂商自身是几千上万人组织,无法 AI-first 化 - 20 人级 AI 创业 + 95% AI 化 + 每天 8 次部署 = 模型厂商也跟不上的迭代速度 - 这是 Sentino 这种 20 人创业公司的窗口期——不在"做更好的模型 / 工具"上比拼,而在"组织 AI-first 化的速度"上比拼
与 pivot-speed-as-moat 的关系:组织效率是 pivot 速度的内在条件,pivot 速度是组织效率的外在表现。两者一起构成层级坍缩中"创业公司可活的窗口"。
对 sentino 的直接含义: - Sentino 当前的中间层位置(在 IP 方 / 模型厂商 / 客户之间)有被坍缩压力,但 Sentino 的组织灵活度是结构性优势——20 人能 pivot,YG / Sanrio / OpenAI / 大客户都不能 - 但这个优势能不能兑现取决于 Sentino 自己是不是 95% AI-first——如果 Sentino 内部还是传统创业流程 + 几个 AI 工具,这个窗口期就不属于 Sentino - 自检题:Sentino 工程 / 产品 / 客户支持 / 销售四个职能里 AI 化比例分别是多少?哪个职能拖低了整体 pivot 速度?
反向制约:分发与平台审核拖累 vibe coding 平台¶
腾讯研究院 2026-04 vibe coding 长文(→ vibe-coding-creator-motives)观察到 vibe coding 平台不只面临模型厂商坍缩压力,还面临传统应用分发渠道的反向制约:
- App Store 政策反弹:以"绕过审核机制的动态代码执行"为由下架或冻结了多个 vibe coding 工具的 iOS 版本——把 AI 实时构建/运行视为违反 4.7 条
- 审核排队拉长:2025 年 12 月 App Store 应用提交量同比增长 56%,审核时间拉长到数周
- 微信小程序合规:备案 5-10 个工作日 + 防沉迷 SDK + 隐私政策 + 个人主体须先注册个体工商户
这给"平台层坍缩"加了一个反向论点:模型厂商可以吃掉 Vibe Coding 平台(如 Lovable / Bolt 的 UI 封装价值),但分发平台(Apple / 微信 / Google)才是最终的"层级守门员"——它们既不是模型厂商也不是中间层平台,而是用户触达渠道,掌握着合规审核与上架权。
层级坍缩在中间层(应用构建工具)发生很快,在分发层短期内不会发生(合规、审核、备案、抽成机制是政策与商业并存的护城河)。Vibe coding 出口的瓶颈正在从"代码生成能力"转移到"上架合规"——这条最后一公里 AI 短期内解决不了。
反向力量:开源模型追平闭源(2026-04 DeepSeek V4)¶
层级坍缩的核心动力是模型厂商利用模型能力优势往上吞应用层。这条动力在模型层"闭源 vs 开源"维度有一个反向力量:
deepseek-v4 在多个 benchmark 上逼平闭源 frontier(SWE-Verified 80.6% vs Opus 4.6 80.8% / Codeforces 3206 超过 GPT-5.4 3168)+ Apache 2.0 开源 + 跨 NVIDIA/Ascend 双栈解耦——这削弱了"必须用闭源 frontier 模型才能做严肃应用"的前提。
含义:
- 中间层 SaaS / 应用构建工具如果能 OEM 切换到开源 frontier,就能部分对冲被闭源模型厂商坍缩的压力——只要开源模型能力跟得上
- 开源模型本身没有动机往上吞应用层(不是产品公司,不变现应用)——结构上不会重演 Anthropic 的 Claude → Claude Code → Cowork → Computer Use 路径
- 但中间层切换到开源仍受三条限定(参见 model-hardware-decoupling):开源工具链仍主要 CUDA / 国产硬件批量上市未发生 / 长上下文检索开源仍落后 ~10 分
engram-conditional-memory 揭示的"模型架构内部往下分层"是另一条反向方向——模型层主体地位上升不仅表现为往上吞,还表现为内部结构精细化(hash 表 + dense + MoE 三种 primitive 共存)。
三条方向(往上吞 / 往下扩散到多家硬件 / 内部分层)共同构成 2026 模型层的全方位主导,但开源 frontier 的存在让中间层至少保留了"切换 backend"的对冲选项。
新坍缩工具:上游撤 OAuth piggyback(2026-04 OpenClaw 案例)¶
层级坍缩的工具集此前主要是"出新产品吃中间层"(Anthropic Claude Code → Cowork → Computer Use 路径)。2026-04 Anthropic 撤销第三方 agentic 工具走 Claude subscription OAuth 的能力给坍缩加了第二种工具——直接通过 OAuth/API access 控制切断中间层的经济基础。
事件事实(WebSearch 2026-04-27 核实)¶
- 2026-02-20:Anthropic 法律条款明确禁止 subscription OAuth tokens 用于第三方工具
- 2026-02~03:服务端静默部署 OAuth token 拦截
- 2026-04-04 12:00 PT:政策正式执行——Claude Free/Pro/Max 订阅不再覆盖第三方 agentic 工具
- 范围:Boris Cherny(Head of Claude Code)X 表态:"applies to all third-party harnesses and will be rolled out to more shortly"——不是单点针对 OpenClaw,是跨所有第三方 harness 的全面策略
- 补偿:一次性 credits = monthly fee + 30% pre-purchase 折扣
经济学:cross-subsidy 的不可持续¶
- 单个 OpenClaw instance 一天可消耗 $1,000–$5,000 API 等价
- $200/月 Max 订阅 ≈ 5–10x 套利空间
- 政策执行时约 135,000 个 OpenClaw instances 在跑——不是边缘小众,是规模级
- Anthropic 第一方工具(Claude Code / Cowork)专门优化 prompt cache hit rate,第三方工具绕过缓存 → 第三方算力成本对 Anthropic 不可持续
→ 与 harness-engineering "Cache 经济学是架构约束"判断的具体实证:第一方相对第三方的 cache 优势不只是工程优化,是结构性成本差——这条差异化决定了上游有动机在政策上切断 piggyback
不是 Anthropic 个案:行业级 pattern¶
Google 2026-02 已先行同样政策:Antigravity / Gemini CLI / Gemini Code Assist 同样禁止第三方 OAuth piggyback。Jack Wotherspoon (Gemini CLI DR):piggyback OAuth 是"direct violation of applicable terms and policies"。
→ 不是"模型厂商个别动作",是从 flat-rate 订阅向 usage-based 计费的全行业转向——AI workload 成熟到一定规模后 cross-subsidy 模式不可持续,所有上游都会向同一方向走
对中间层 agent 框架的含义¶
- OpenClaw 框架本身没停服——用户自带 API key 走 pay-as-you-go 即可继续用
- 但中间层平台失去了"用户用 $200 拿 $1000-5000 价值"的隐性补贴——这等于给中间层抬了一个数量级的价格门槛
- 之前靠"订阅价比 API 便宜"建立用户基数的中间层平台需要重定价或换模式
- amphiflow-pattern "workflow 优先 + agent 兜底"等省 token 架构在新定价环境下价值上升——异常路径走 agent 之外大部分调用走 workflow,对 token 成本敏感的中间层多了一个生存策略
对 Sentino 的具体含义¶
Sentino 当前向客户卖 Standalone Agent(sentino-agent)—— Sentino 自己处于"上游模型 + 下游客户"之间的中间层位置。这个事件的含义: - 如果 Sentino 用 Anthropic API 服务客户,Sentino 是直接付 API 客户,不在 OAuth piggyback 范围内——不直接受影响 - 但这个事件证明上游对中间层的政策权力——上游可以随时调整定价 / 限制使用方式 / 优先自家产品。Sentino 长期不能假设上游 API 价格 / 政策稳定 - 与 model-hardware-decoupling 的连接:上游政策风险是 hedge multi-vendor 的具体动机——保留切换到开源模型 / 多家 LLM 的能力对中间层是结构性安全保障
坍缩在分销层的延伸:PE-anchored FDE JV(2026-05-04)¶
Anthropic / OpenAI 同日宣布 PE-anchored FDE JV(2026-05-04)把平台层坍缩从软件中间层延伸到分销渠道层 + 部署服务层——之前模型公司直接吞应用层(Claude Code / Cowork / Computer Use / Google Agent Platform),现在通过 JV 把 mid-market 分销渠道 + FDE 部署服务一并拿下。
坍缩链路新增 2 层:
Before(2026-04 之前坍缩链路):
模型 → 应用层 → 客户
Now(2026-05-04 之后扩展链路):
模型 → 应用层 → 分销渠道层(PE 财团)→ 部署服务层(FDE JV)→ 客户 EBITDA
结构性威胁对象扩展:
| 之前坍缩威胁的中间层 | 2026-05-04 扩展后新增威胁对象 |
|---|---|
| Vibe Coding 平台 / 通用 agent 框架 | + 传统咨询公司(Accenture / Deloitte / McKinsey 数字化业务)—— Fortune 5-04 标题直接说 "Anthropic takes shot at consulting industry" |
| 应用层 SaaS / 通用 IDE 套壳 | + mid-market 独立销售公司 / 区域 IT 集成商 —— PE-anchored JV 给 PE 阵营 portco 优先销售权,独立销售难以竞争几周级 procurement 压缩 |
关键差异化:之前坍缩是 frontier 模型公司自己出产品吃应用层;2026-05-04 坍缩是 frontier 模型公司通过独立 JV 实体吃分销层 + 部署服务层(详见 IPO 估值双轨结构 解释为什么用 JV 而非 in-house)——同样是吞噬,但法律主体不同 + 财务报表不同 + Liability Wall 的责任归属不同。
含义:
- 坍缩的工具集从单纯"出产品 / 撤 OAuth piggyback"扩到"PE 渠道战略合作"——上游可用工具更多元
- 中间层 agent 应用要躲开坍缩,不只要躲开"被模型公司产品吞",还要躲开"被 JV 部署服务吞"——双线压力
- 但JV 模式只覆盖 PE-owned portco 子集 —— 全市场仍有大量非 PE-owned 中型企业 / 消费者市场不在这个渠道辐射内(详见 pe-anchored-ai-distribution 全市场天花板段),给独立中间层留了一片可达市场
反向力量:过程数据是不可坍缩的 substrate¶
赵赛坡 2026-04 评论文章给坍缩论加了第三个反向力量——单纯 agent 外壳确实会被坍缩,但行业过程数据不会:
模型可以调用,界面可以模仿,真正稀缺的是行业里的真实工作记录:谁有权限,谁能确认,哪些步骤可以跳过,异常出现时谁来决定。这些东西不在产品介绍里,通常藏在工单、群聊、会议纪要和老员工的习惯里。
含义: - 模型厂商可以坍掉 vibe coding 的 UI 层,但拿不到客户公司内部的过程数据 - 这是 process-data-vs-output-data 视角对 ai-agent-moats "垂直专精"的具体支撑——专精的载体是过程数据,不是 UI - 由此预测的新公司类型("流程改造、数据清洗、隐私合规、行业 skill 库、企业 AI 治理")正是模型厂商难以伸手的领域
相关概念¶
- harness-engineering — Claude Code 的工程架构,层级坍缩的技术基础
- ai-agent-moats — Feature Moat 已死 + Vibe Coding 平台的四道脆弱防线
- parasocial-monetization — IP 授权型拟社交变现高度抗坍缩
- agent-ui-is-product — UI 是坍缩后仅存的差异化,但也是最易被替代的
- orchestration-free-agents — 多 Agent 协作替代编排框架,吞噬开发流程的一种形态
- mcp-protocol — 开放标准是生态护城河基础设施,但也加速了层级坍缩
- claude-agent-sdk — Anthropic 最新坍缩动作:从模型 API 向 Agent 运行时层延伸
- vibe-coding-creator-motives — 分发与审核反向制约 vibe coding 平台坍缩
- pivot-speed-as-moat — 创业公司组织效率是层级坍缩中的反向窗口
- ai-first-engineering — CREAO 是这个反向窗口的极端样本(20 人 / 99% AI / 每天 8 次部署)
- training-inference-bifurcation — 方向相反的镜像现象:软件层往上收敛,硬件层往下分叉为训练/推理两颗 SKU
- deepseek-v4 — 开源 frontier 模型追平闭源是中间层的反向对冲信号
- engram-conditional-memory — 模型架构内部往下分层,与往上吞同源
- model-hardware-decoupling — 模型层主体地位上升的第三个方向(往下扩散到多家硬件)
- process-data-vs-output-data — 过程数据是不可坍缩的 substrate,行业 know-how 藏在过程里
- bottleneck-shift-output-to-review — 单纯 agent 外壳不长期值钱,因为审核能力(=行业 know-how)才是稀缺资源
- amphiflow-pattern — 第三条路(workflow + agent 融合)对中间层 agent 框架是新生存窗口——不与"模型厂商坍缩 UI"和"开源模型坍缩闭源"任一方向直接对冲
- research-preview-pattern — Kat Wu 访谈关于"优先第一方"的表态对应本页"撤 OAuth piggyback"段事件的 PM 视角侧写
- agent-creator-refiner-operator — Creator 是模型公司必吃赛道(Claude Code → Cowork → Computer Use),Refiner+Operator 是中间层的真正生存空间——三道护城河(Integration Moat / Liability Wall / Private State Machine)是结构性的
- google-agent-platform — 最强单一证据:Google 一次性宣布 4 pillars × 18 组件全栈内化,比 Anthropic 时间线分段推进更激进
- anthropic-openai-pe-jv-2026-05 — 2026-05-04 坍缩在分销层 + 部署服务层的延伸:frontier 模型公司通过独立 JV 实体吞 mid-market 分销渠道 + FDE 部署服务
- forward-deployed-engineer — 被坍缩的具体服务形态(Palantir 立的 FDE 模式被 Anthropic / OpenAI 行业级复刻)
- pe-anchored-ai-distribution — PE 财团作为 AI 分销渠道的结构性论证(坍缩链路新增的"分销渠道层")
- ipo-valuation-dual-track — JV 模式而非 in-house unit 的财务动机解释
- 大企业垂直整合自建实证(反向坍缩信号) — Walmart 用 Microsoft Azure OpenAI + 自建 4 个 super agents(Sparky/Marty/Wally/Associate Agent),Self-Healing Inventory 真实节省 $55M——大客户都自建,给中间层 agent 应用结构性威胁。详见 raw/notes/walmart-agentic-ai-strategy-2026-04-27
- Anthropic 4-23 博客的反向叙事修正 — OpenClaw 撤 OAuth piggyback(4-04)→ Perplexity CTO 出走(3-11)→ Peter Steinberger 痛批 → 社区情绪低落 → Anthropic 官方 4-23 博客 Building agents that reach production systems with MCP 主动定义新边界:"MCP 没死,但范围明确收缩到云端生产 agent 标准化接入层"。Tool Search(85% token 减少)+ Programmatic Calling(37% token 减少)+ Cloudflare 2 工具覆盖 2,500 端点案例 = 上游对中间层叙事危机的工程化反击。详见 mcp-protocol "2026-Q1 社区批评 + Anthropic 4-23 官方回应" 段