2026-04-27 变更日志¶
Dream-2026-04-27 Bucket 2 + Lint 1 修复¶
来源:wiki/journal/dream-2026-04-27.md 分诊队列直接落地。
Bucket 2:补 4 条单向缺失的反向交叉引用¶
dream-2026-04-27 识别 5 条 Bucket 2 候选,其中 D(claude-agent-sdk ↔ agent-runtime-architecture)经核查实际已双向链接(dream 误报,将在下次 dream 反馈环改进 grep 校验逻辑),其余 4 条全部落地:
concepts/harness-engineering— 相关概念末尾加 embedded-firmware-layering 反向链接,注"Sentino 嵌入式领域同构应用:rino_interface 适配层 import/export = Driving/Driven Port"——闭合 2026-04-24 ingest 中只单向落地的"组织级架构判断一致性"叙事concepts/ai-agent-moats— 相关概念末尾加 pivot-speed-as-moat 反向链接,并显式标注两页对"护城河"定义不同(本页慢变量壁垒 vs pivot-speed 反对的功能型/产品型壁垒)——闭合 dream-2026-04-20 Bucket 2.A + 顺手处理 dream-2026-04-20 Bucket 3.A 的"定义打架"显式标注建议concepts/hidden-chokepoints— 相关概念末尾加 profit-source-ethics 反向链接(profit-source-ethics → hidden-chokepoints 已在 2026-04-20 ingest 中加上,本次补反向)——闭合 dream-2026-04-20 Bucket 2.B 的双向建议concepts/asymmetric-chokepoints— 相关概念末尾加 model-hardware-decoupling 反向链接,注"模型厂商对中美 AI 卡脖子非对称博弈的产品级回应"——闭合 2026-04-24 ingest 中 journal 声明但页面未落地的关系(dream-2026-04-27 Bucket 2.E)
Lint 1:报告页 frontmatter 缺字段修复¶
wiki/reports/2026-04-24-deepseek-v4-6.1-tflop-gbps-deep-dive.md— frontmatter 加created: 2026-04-24+updated: 2026-04-24(与 lint 要求的 REQUIRED_FIELDS 对齐,保留原有date字段)templates/report.md— 模板同步加created/updated占位,避免后续新建 report 重蹈覆辙——根因修复,不只修当前实例
scripts/lint.py 重跑:✓ Wiki 健康检查通过(共 108 个页面)。
元观察¶
- dream → 落地反馈环跑通第三次(前两次:2026-04-20 Bucket 2.C 闭合于当日 ingest;2026-04-24 第四节闭合 dream-2026-04-20 Bucket 2 的 compute-vs-bandwidth 张力)。本次是"专门触发反馈环"的第一次,而非顺手随 ingest 闭合
- dream 误报第一例:D(claude-agent-sdk ↔ agent-runtime-architecture)实际已双向链接。dream 流程未做"grep 双向校验",下次更新 dream-prompt.md 时考虑要求每条 Bucket 2 候选必须显式 grep 两侧 + 引用结果
- Bucket 2.B "journal 声明 ≠ 页面落地"模式确认是反复出现的:dream-2026-04-20 Bucket 2.B 是上一例(profit-source-ethics ↔ hidden-chokepoints 在 journal 写明但页面单向),本次 dream-2026-04-27 Bucket 2.E 同模式(model-hardware-decoupling ↔ asymmetric-chokepoints)。建议 ingest 流程末尾加一步 "grep 校验所有 journal 中声明的 wikilink 是否真的写到了两侧页面"
- lint 与 templates 不一致:lint REQUIRED_FIELDS 包含 created/updated,templates/report.md 此前缺这两字段。本次同步修复模板,避免发散
待办¶
- 下次更新
scripts/dream-prompt.md时,给 Bucket 2 candidate 加"必须先 grep 两侧验证"硬约束 + 加"扫 journal 中声明的 wikilink 是否两侧都落地"作为 lint 补充
摄取赵赛坡《你的工作经验,正在被写进 AI 系统》(同日追加)¶
来源:raw/notes/zhao-saipo-work-experience-ai-skill-2026-04-27.md(赵赛坡 Poe newsletter 2026-04-27 评论文章,综合三案例 + 经验所有权讨论 + 审核成新瓶颈 + agent 落地难点判断)
新建页面(3 页)¶
concepts/process-data-vs-output-data— 过程数据 vs 产出数据对照表 + 三案例的三种过程数据攫取路径(Meta MCI 植入员工电脑 / cielo24-SimpleClosure 倒闭打包 / 同事.skill 经验封装)+ 与 reinforcement learning gyms 的关系 + Sentino 应用含义(Standalone Agent 真正资产不在 latest 输出,在工具调用序列)concepts/work-experience-ownership— 经验所有权法律真空(劳动法/知识产权/数字治理三道空白)+ 陈天昊(清华公管长聘副教授)观点 + 三种剥离形态 + 与 profit-source-ethics 姊妹关系(机制 2 资本-劳动身份分裂在经验封装语境的具体应用)+ 反向运动"反克隆 skill"+ 中国语境的特殊性(绕过员工同意走绩效语言)concepts/bottleneck-shift-output-to-review— AI 时代瓶颈位移模式(生产 → 审核 → 标准制定 → 战略判断)+ 媒体案例(4 人公司帮某媒体客户日产 20→200 篇 / 85% 不需人工)+ 三阶段(旧均衡/短期失衡/3a 审核也 AI 化 vs 3b 审核保留人工)+ 适用边界(不适用法律/医疗/金融)+ Sentino 应用(TENGA 医生审核成新瓶颈,影响商务定价)
关键知识提取¶
-
过程数据 vs 产出数据是 Agent 训练材料的关键新分轴 — 公开文本/代码/论文是产出数据(已商品化),鼠标轨迹/Slack 聊天/Jira 工单/SOP 是过程数据(最难获得的训练材料)。Anthropic 高管讨论花费高达 $1B 在 reinforcement learning gyms 训练基础设施上。三案例同源——都不再依赖产出数据,都把"人一步步把事情做完"当成核心资产 → 与 process-data-vs-output-data 的连接:本概念页就是为承接这条洞察而抽出的;同时回连 harness-engineering(Harness 是基础设施层 vs 过程数据是训练层,agent 工程的两面)+ ai-agent-moats(垂直专精护城河的真正载体是过程数据)
-
经验所有权落在劳动法-知产-数字治理三道法律空白的夹缝里 — 陈天昊(清华公管长聘副教授)核心论点:人的思维习惯/逻辑判断/部分经验过去依附在劳动者本人身上,现在企业要求"上交"时归属没有明确答案。劳动法没覆盖默会知识、知产法没覆盖流动经验、个保法没覆盖职业行为数据。"企业不会等规则完善后再行动"——已经在让员工写 skill,法律和公司制度往往会慢半拍 → 与 work-experience-ownership 的连接:本概念页就是为承接这条法律真空而抽出的;与 profit-source-ethics 形成姊妹关系——一页讲钱怎么赚,一页讲经验怎么收。机制 2 "资本-劳动身份分裂"在经验封装语境有具体应用:员工作为劳动者上交经验,作为投资人买回封装这些经验的 AI 公司股票
-
AI 渗透各行业的共同瓶颈位移模式:产能上限 → 审核上限 — 媒体案例:日产 20→200 篇 / 85% 不需人工 / 但审核成卡点。"过去上限是编辑写作速度,现在上限变成审核能力"。这不是某行业的偶然现象,是 AI 介入产能侧的普遍模式。CREAO 选 3a 路径(审核也 AI 化),多数企业还停在 3b(审核保留人工 → AI 介入收益被吃掉) → 与 bottleneck-shift-output-to-review 的连接:本概念页就是为承接这条普遍模式而抽出的;与 ai-first-engineering CREAO 瓶颈级联原则同源但视角不同——CREAO 讲三个新瓶颈(PM/QA/人员)的解法,本页讲多数企业卡在审核瓶颈的中间状态
-
单纯 agent 外壳不长期值钱,因为审核能力 = 行业 know-how = 过程数据 — 赵赛坡判断:"模型可以调用,界面可以模仿,真正稀缺的是行业里的真实工作记录:谁有权限,谁能确认,哪些步骤可以跳过,异常出现时谁来决定。这些东西不在产品介绍里,通常藏在工单、群聊、会议纪要和老员工的习惯里。"——这给 platform-layer-collapse 加了第三个反向力量 → 与 platform-layer-collapse 的连接:在该页"反向力量"段新增"过程数据是不可坍缩的 substrate"段——模型厂商可以坍掉 vibe coding UI 层,但拿不到客户公司内部的过程数据。预测的新公司类型(流程改造/数据清洗/隐私合规/行业 skill 库/企业 AI 治理)正是模型厂商难以伸手的领域
-
个体 vs 组织 AI 困境补第五重:经验上交的合法性危机 — Sivulka "AI 让每个人变快了但公司没变强" 在数据视角有具体解释:组织变强的路径是把员工经验集中到组织级 AI,但集中过程触法律真空。这条困境的特殊性在于它不在 AI 技术能力范围内——靠模型升级解决不了"员工凭什么把自己的隐性知识无偿上交" → 与 individual-vs-institutional-ai 的连接:在该页"四重组织困境"段新增"第五重:经验上交的合法性危机"段,引用 work-experience-ownership 法律真空 + process-data-vs-output-data 数据侧解释;这是 Sivulka 论点的 2026-04 现实补充
-
Sentino 战略含义:Standalone Agent 真正资产不在 latest 输出 — 当前 Standalone Agent 工具化模式让主 agent 通过 read_xx 读 latest,但真正的长期价值沉淀在 agent 执行过程——工具调用序列、中间判断、回退点、异常处置路径。这些目前没有结构化沉淀。同时 Memex 当前记产出(事实/偏好),未覆盖过程数据(agent 完成任务的最佳路径),是潜在扩展方向 → 与 sentino-agent / sentino-memex 的连接:在 sentino-agent 相关概念加 process-data-vs-output-data + work-experience-ownership + bottleneck-shift-output-to-review 三页;sentino-memex 加两页过程数据视角与 Memex 的关系判断
更新页面¶
concepts/individual-vs-institutional-ai— 新增"第五重:经验上交的合法性危机"段;相关概念加 3 个新页;sources 加新 raw;updated → 2026-04-27concepts/profit-source-ethics— 相关概念加 work-experience-ownership 一行 + 显式注姊妹关系(钱 vs 经验);sources 加新 raw;updated → 2026-04-27concepts/harness-engineering— 相关概念加 process-data-vs-output-data 一行 + 注"agent 工程的两面"concepts/agent-tool-design— 新增"Skill 在企业落地的所有权问题(2026-04 现实约束)"整段;相关概念加 work-experience-ownership;sources 加新 raw;updated → 2026-04-27concepts/ai-first-engineering— 瓶颈级联原则段新增"CREAO 选 3a / 多数企业停 3b" 一段(带 bottleneck-shift-output-to-review 跳转);相关概念加 bottleneck-shift / process-data;sources 加新 raw;updated → 2026-04-27concepts/ai-agent-moats— 垂直专精护城河段新增"真正的载体是行业过程数据"段;相关概念加 process-data;sources 加新 rawconcepts/platform-layer-collapse— 新增"反向力量:过程数据是不可坍缩的 substrate"整段;相关概念加 process-data + bottleneck-shift;sources 加新 raw;updated → 2026-04-27concepts/sentino-memex— 相关概念加 process-data + work-experience-ownership 两行(潜在扩展方向 + 客户向所有权约定)projects/sentino-agent— 相关概念加 process-data + work-experience-ownership + bottleneck-shift 三行;sources 加新 raw;updated → 2026-04-27concepts/ai-adoption-landscape-2026— 相关概念加 process-data + work-experience-ownership 两行concepts/liberal-arts-ai-crisis— 相关概念加 work-experience-ownership 一行(同源 AI 揭穿模式)wiki/index.md— 行业格局子分区加 process-data + bottleneck-shift;社会与心理分区末尾加 work-experience-ownership;最近更新加一条 2026-04-27
事实核查记录¶
- WebSearch "同事.skill 新京报 离职员工 AI 数字分身" → 核实「同事.skill」项目 2026-03-30 GitHub 上线(开发者 titanwings)/ 5 天 6600+ stars / 新京报 AI 研究院专题报道 / 衍生"张雪峰.skill"等 / 律师张延来分析法律层 / 反向工程师邓小闲koki 写"反克隆 skill" → 用于 process-data-vs-output-data 案例三 + work-experience-ownership 反向运动段
- WebSearch "Meta Model Capability Initiative Reuters mouse keyboard AI agent training" → 核实 Meta MCI 真实 / 2026-04-21 Slashdot 转载 Reuters 独家报道 / Meta SuperIntelligence Labs 内部备忘录 / Andrew Bosworth 把项目重命名为 Agent Transformation Accelerator (ATA) / Andy Stone 官方辩护"训练用途非绩效用途" / 员工无法 opt-out / Meta 同期裁员 10% + 创建 AAI 团队 / 创造 "AI builder" 通用职位 → 用于 process-data 案例一 + work-experience-ownership 三种剥离形态表
- WebSearch "cielo24 SimpleClosure Forbes Slack Jira data sale AI training bankruptcy" → 核实 Forbes 报道 / Shanna Johnson cielo24 CEO / SimpleClosure CEO Dori Yona / Asset Hub 平台过去一年 100 笔交易 / 单笔 $10K-$100K / "reinforcement learning gyms" 训练用途 / Anthropic 高管讨论 $1B 训练基础设施 / Marc Rotenberg 隐私担忧 → 用于 process-data 案例二 + 与 reinforcement learning gyms 的关系段
- WebSearch "陈天昊 清华大学 公共管理学院 长聘副教授 数字治理" → 核实身份完全:清华公管长聘副教授 + 法学院准聘副教授兼博导 + 政府法制研究中心主任 / 西南政法行政法学院本科 / 研究领域行政法/法国及欧盟法/数据法学 / 在数字复活 / 数据法学相关议题有公开论述 → 用于 work-experience-ownership 法律真空段引述
- WebSearch "Do Engine AI agent" → 未找到独立产品对应,可能是赵赛坡文中对 Anthropic Skills + Computer Use 类"做"系产品的概念性指称。raw 保留原文表述,wiki 不基于此名做独断(在 raw 段落里以"Do Engine 这类 agent 应用"原样引用,不在 wiki 抽具体产品判断)
- 客户文档陷阱检查:本次素材是赵赛坡评论文章,不是客户向 PRD/RFP/提案/合同,不触发该专项检查。文中提到的 Anthropic Skills / Meta MCI / mem0 / Pinecone 等都是行业横向案例,不是客户已选型问题
- "媒体客户日产 20→200 / 85% 不需人工":按新京报采访原文未独立复核,已在 bottleneck-shift 页明确标注"按新京报采访原文,未独立复核"+ 限定(媒体内容是 language 任务的甜蜜区,不可推广到法律/医疗/金融)
待办¶
- 中国是否率先出现"经验所有权"相关诉讼判例?追踪 2026 下半年的劳动仲裁/民事案件,回 work-experience-ownership 页"待观察"段补条
- Meta MCI 是否被美国劳动部门或欧盟以 GDPR 介入?追踪后续政策文件,回 work-experience-ownership 页
- 大公司劳动合同模板是否在 2026 年加入"AI 训练数据条款"?这是 work-experience-ownership 法律框架开始成形的最早信号
- "Do Engine" 究竟指什么产品?追问用户或下次摄取赵赛坡文章时确认;如果是 Anthropic 的 Computer Use 类产品的代号,可在 wiki 加术语映射
- Sentino 是否考虑把 Standalone Agent 执行过程结构化沉淀(工具调用序列 + 中间判断 + 回退点)作为长期资产?这是过程数据视角对 Sentino 的具体行动建议,但当前没有产品决策依据,先放在待办里等下次产品复盘讨论
- bottleneck-shift 视角对 sentino-tenga 商务定价的具体含义(按辅助审核 vs 按 token 计费)值得在下次 TENGA 战略讨论时引入
摄取张铁蕾《为什么 agent 和 workflow 可以融合在同一个架构里?》(同日追加)¶
来源:raw/notes/zhang-tielei-amphiflow-agent-workflow-fusion-2026-04-25.md(张铁蕾 公众号"铁蕾" 2026-04-25 19:57 北京,技术架构 deep-dive 含代码片段,介绍作者自创的 amphiflow 架构 + AmphiLoop 框架;GitHub https://github.com/bitsky-tech/AmphiLoop;前文引用《万字长文!两栖模式构建 Agent,与 OpenClaw/Hermes 不一样的解法》和《AI Agent 时代的软件开发范式》"编程范式从面向 step 到面向 goal")
新建页面(3 页)¶
concepts/amphiflow-pattern— Amphiflow 模式(workflow ↔ agent 融合架构):默认 workflow 模式(不依赖 LLM 节省 token)+ 出错两级降级(小降级 snapshot agent 修复当前 step / 大降级 on_agent 重启动整个 agentic loop)+ 与 n8n/dify/OpenClaw/Hermes/CoWork/Claude Code 6 系对照表 + 适用边界 + Sentino Standalone Agent v2 演进的备选架构判断concepts/decision-execution-decoupling— 决策与执行解耦:把 Agent 循环里"决策来源"(LLM / workflow 代码)与"执行机制"拆成两件事的架构原则 + Python yield + generator 实现细节 + 与 Layer 4 Tool Runtime 的关系(Tool Runtime 解耦执行,amphiflow 进一步解耦决策源)+ 工具接口设计 LLM-friendly 妥协的松绑concepts/observe-think-act-cycle— OTA 循环:agent 内部最基础的 Observe → Think → Act 三步抽象 + 与 SEAL 的关系(SEAL 是 OTA 在语音场景的特化)+ 与 agency-framework 时间尺度区别 + 在已知 6 系 agent runtime 中的具体形态对照表 + 待观察"是否会成为业界统一术语"
关键知识提取¶
-
amphiflow 是"workflow 优先 + agent 兜底"的第三条路 — 2026 行业语境里 workflow 类(n8n / dify)和自主性 agent 类(OpenClaw / Hermes / Eigent CoWork)是两条互斥的路。Amphiflow 把两者当成同一架构里的两种运行模式:默认 workflow(确定性、不耗 token)+ 出错时两级降级到 agent。第三条路独立于"全 workflow"和"全 agent"——区别于 platform-layer-collapse 的两个方向(模型坍缩 UI / 开源坍缩闭源),amphiflow 给中间层 agent 框架提供了不被任一方向直接冲击的新生存窗口 → 与 amphiflow-pattern 的连接:本概念页就是为承接这条架构定位而抽出的;回连 platform-layer-collapse(中间层新生存窗口)+ ai-agent-moats(workflow 模式不依赖 LLM = 成本结构是潜在新护城河维度)
-
决策与执行解耦让 workflow 与 agent 共享 OTA 循环 — 传统理解里 agent 模式(LLM 既产生决策也驱动循环)和 workflow 模式(代码既描述步骤也直接执行)是两套基础设施。AmphiLoop 用 Python yield + generator 把"描述"和"执行"分开——
yield ActionCall(...)那一刻只是产生 Decision,真正执行延迟到外层循环的_action(decision, ctx)。关键架构判断:执行层只看 Decision 不关心来源,LLM 与 workflow 代码都是合法源 → 与 decision-execution-decoupling 的连接:本概念页就是为承接这条架构原则而抽出的;与 agent-runtime-architecture Layer 4 关系——Layer 4 解耦"执行",amphiflow 进一步解耦"决策源",是 Layer 4 抽象往源头方向的延伸 -
OTA 循环值得作为独立"原子词"独立成页 — wiki 已有 seal-architecture 但 SEAL 是 OTA 在语音场景的特化(+ 流式感知 + Think While Listening + Speak While Thinking)。OTA 自身的抽象边界比 SEAL 或 amphiflow 都更基础:OTA 不假设语音场景,也不假设 Think 必须由 LLM 产生。三层抽象关系:最基础是 OTA / 语音特化是 SEAL / 模式切换扩展是 amphiflow → 与 observe-think-act-cycle 的连接:本概念页就是为承接 OTA 作为基础抽象而抽出的;同时回连 seal-architecture 加上"OTA 是 SEAL 基础抽象"段(去掉语音特化后的通用循环),把 SEAL 重新定位为 OTA 的语音特化版本
-
Amphiflow 是 iOS 外壳 + Android 内核的混合形态 — amphiflow 在 harness-engineering 两层定义里偏 iOS 模式(封闭定义运行环境):workflow 部分由 AmphiLoop 根据 TASK.md 引导生成代码、模式切换由框架统一管理、阈值由框架默认提供。但 workflow 内部用户可写动态控制流(for / while / if / continue),又给开发者保留了 Android 风格的灵活度。这与传统纯 workflow 工具(n8n 拖拽 GUI)和纯 agent 框架(OpenClaw 完全开放)都不同——给 Harness 两层定义之外加了第三种取舍维度 → 与 harness-engineering 的连接:在该页相关概念加 amphiflow-pattern 一行 + 注"iOS 外壳 + Android 内核的混合形态"
-
对 Sentino Standalone Agent v2 是潜在演进路径,但当前阶段不引入 — Sentino 当前 Standalone Agent = 纯 agent loop(指令 + 工具选择 + 触发条件 + LLM 自判完成)。amphiflow 视角的潜在 v2:高频固定模式 standalone agent 第一次跑通后凝固为 workflow,后续走 workflow + 异常降级。好处:token 成本与触发频率脱钩 + workflow 部分确定性 + agent 兜底保留灵活性。张力:(1) 与 agent-tool-design "逃生工具"原则有张力(workflow 凝固后"现造工具"自由度受限);(2) 与 CREAO "Coding Agent 是 connector 元工具" 主张方向相反(CREAO 让 agent 现写代码扩展长尾,amphiflow 让 workflow 凝固通用路径)。判断:当前阶段不引入;触发重新评估的两个条件——Standalone agent 实例数 >10K + 高频固定模式占比 >50%,或客户开始抱怨 standalone agent 行为不可预测 → 与 sentino-agent 的连接:在该页新增"Amphiflow 视角的 Standalone Agent v2 评估"整段,含当前 vs 潜在 v2 对照表 + 两条张力 + 重新评估触发条件;相关概念加 amphiflow-pattern + decision-execution-decoupling + observe-think-act-cycle 三页
-
作者商业立场需要显式标注 — 张铁蕾自称 "amphiflow 是世界上第一个决策与执行解耦的架构"。未独立核实——本知识库不替"世界第一"宣言背书。但从 2026-04 时点已知 agent runtime 看(OpenClaw / Hermes / n8n / dify / Claude Code Agent Loop),AmphiLoop 确实是第一个把"决策源"和"执行机制"明确做成两个解耦的轴并提供两种模式自动切换的——这条比"世界第一"自称更精确。两个新概念页都明确标注 "作者自称,未独立核实" → 与事实核查记录的关系:见下文事实核查段;与 ai-vendor-spec-traps 的方法论一致——批判性消费厂商/作者宣称是 wiki 的默认动作
更新页面¶
concepts/seal-architecture— 定义段后插入"SEAL 是 OTA 在语音交互场景的特化版本"一段,把 SEAL 重新定位为更基础的 OTA 之上的特化层;相关概念加 observe-think-act-cycle + amphiflow-pattern;sources 加新 raw;updated → 2026-04-27concepts/agent-runtime-architecture— 相关概念末尾追加 3 行(observe-think-act-cycle / amphiflow-pattern / decision-execution-decoupling)+ 各自一句话连接含义;sources 加新 raw;updated → 2026-04-27concepts/harness-engineering— 相关概念加 amphiflow-pattern 一行 + 注"iOS 外壳 + Android 内核的混合形态";sources 加新 rawconcepts/agent-tool-design— 相关概念加 decision-execution-decoupling 一行 + 注"工具的产生者可以不是 LLM"concepts/claude-agent-sdk— 相关概念加 amphiflow-pattern 一行 + 注"另一种 batteries-included 思路:默认 workflow 模式"concepts/orchestration-free-agents— 相关概念加 observe-think-act-cycle 一行 + 注"多 Agent 协作里每个 Agent 内部都是 OTA"concepts/platform-layer-collapse— 相关概念加 amphiflow-pattern 一行 + 注"第三条路对中间层 agent 框架是新生存窗口"projects/sentino-agent— 新增"Amphiflow 视角的 Standalone Agent v2 评估"整段(当前 vs 潜在 v2 对照表 + 两条张力 + 重新评估触发条件 + 当前阶段不引入判断);相关概念加 amphiflow-pattern + decision-execution-decoupling + observe-think-act-cycle 三页;sources 加新 raw;updated → 2026-04-27wiki/index.md— Agent 框架与架构子分区末尾加 3 个新条目(observe-think-act-cycle / decision-execution-decoupling / amphiflow-pattern);最近更新加一条 2026-04-27
事实核查记录¶
- AmphiLoop GitHub https://github.com/bitsky-tech/AmphiLoop / bridgic 仓库 / 张铁蕾本人作者身份 → 因 subagent 网络层证书问题未跑 WebFetch 独立核实,按素材原文标注(作者自称 + 项目链接),下次 ingest 时如有机会回头补独立核实
- "amphiflow 是世界上第一个决策与执行解耦的架构" → 作者自称,未独立核实。两个新概念页(amphiflow-pattern + decision-execution-decoupling)显式标注;从 2026-04 时点已知 agent runtime 看(OpenClaw / Hermes / n8n / dify / Claude Code Agent Loop),AmphiLoop 确实是第一个把"决策源"和"执行机制"明确做成两个解耦的轴并提供两种模式自动切换的——本知识库给的是这条更精确的判断,不是"世界第一"宣言
- "OpenClaw / Hermes / CoWork" / "n8n / dify" → 在已有 wiki 多次出现的产品名,本次未单独核查;作者把 n8n/dify 归 workflow 类、OpenClaw/Hermes/CoWork 归自主 agent 类的二分与已有 wiki 描述吻合
- AmphiLoop 项目 GitHub stars 数(约 42,2026-04-27)→ 写入 amphiflow-pattern "待观察"段,与 OpenClaw 头部项目差距大,用作"采纳能否扩散"的待观察信号
- 客户文档陷阱检查:本素材是技术博客 + 开源项目宣传文,不是客户向 PRD/RFP/提案/合同,不触发该专项检查。但作者本人是 AmphiLoop 商业项目创始人——区分技术判断 vs 商业宣传是本次 ingest 的核心态度,"世界第一"宣称已显式标注
待办¶
- 网络层稳定后回头跑 WebFetch 核实 AmphiLoop / bridgic GitHub 仓库 + amphibiousautoma.py 文件路径 + 张铁蕾本人项目身份,回 amphiflow-pattern / decision-execution-decoupling 两页"事实核查"段补条
- 2026 下半年是否有其他 agent runtime(Claude Code / Anthropic SDK / OpenAI Agents SDK / LangGraph)跟进 "workflow 优先 + agent 兜底" 模式?追踪验证 amphiflow 架构是否会成为行业方向,回 amphiflow-pattern 待观察段
- amphiflow 在长上下文 + 多轮工具调用任务上的实际 token 节省比例是多少?作者博文未给定量数据,待第三方独立测量数据出来后补充
- Sentino Standalone Agent v2 阶段(实例数 >10K + 高频固定模式占比 >50% 或客户开始抱怨行为不可预测时)重新评估是否引入 amphiflow,参考 sentino-agent 页"Amphiflow 视角的 Standalone Agent v2 评估"段
- ReAct(Reasoning + Acting)框架与 OTA cycle 的关系——ReAct 主要描述 LLM 怎么交替"推理"和"行动",OTA 多了 Observe 这一步——Observe 显式化是有价值的还是多余的?值得后续摄取 ReAct 原 paper 时回头比较,回 observe-think-act-cycle 待观察段
- 元观察:本次 ingest 由 subagent 执行时 2 次撞到 "unknown certificate verification error"——可能是 WebFetch 调用域名预检的证书校验问题。下次 ingest 如再次出现,考虑由主 agent 直接执行而非派 subagent
摄取 AGIHunt《Anthropic Kat Wu:从 6 个月到 1 天的发版秘密》(同日追加)¶
来源:raw/notes/anthropic-kat-wu-pm-shipping-cadence-2026-04-25.md(搜狐 IT 频道转载 AGIHunt 文章 https://www.sohu.com/a/1014398717_122189055,2026-04-25 12:05 北京。原素材是 Lenny Rachitsky 播客访谈 Kat Wu,Anthropic Claude Code + Cowork PM)
新建页面(1 页)¶
concepts/research-preview-pattern— Anthropic 把 6 个月发版周期压至 1 天的具体工程化机制:Research Preview(发"未完成"的合法性)+ Launch Room(发布流程的 evergreen 频道化)+ 工程师 PM 融合(决定写什么 + 能写出来 = 同一人)三机制互锁;附"删功能习惯""副作用:产品一致性代价"+ 与 CREAO/harness/pivot-speed 三对照 + Sentino 应用判断 + 适用边界
关键知识提取¶
-
Anthropic 6 个月→1 天发版的三个互锁机制 + 速度来自流程而非模型 — Kat Wu 明确:"大部分加速来自流程和团队文化"——内部用模型确实加快,但不是模型能力本身。三机制单独看都不新鲜(早期版本概念有 Beta、跨职能频道化各家都有、PM 工程化也有先例),关键是三件事必须同时成立:缺 Research Preview 则发布门槛高 → Launch Room 没东西可发;缺 Launch Room 则跨职能等齐才能发;缺工程师 PM 融合则节奏卡在沟通成本 → 与 research-preview-pattern 的连接:本概念页就是为承接这条三机制互锁判断而抽出的;与 pivot-speed-as-moat 的连接:在该页相关概念加 research-preview-pattern 一行 + 注"Anthropic 是该判断的第三个独立样本(CREAO + Cursor 之后),证明速度即护城河不是创业公司专利——千人级已建组织也可工程化达成"
-
删功能是模型升级的首要响应:Harness 不是单调累积 — Kat:"每次发布新模型,我们都会通读整个 system prompt,逐段反思:模型还需要这个提醒吗?如果不需要了,就删掉。"具体例子:Claude Code 早期待办事项功能 → 升级 Opus 4 后变可选(模型自主列清单了)。这条对 harness-engineering 的补充:Harness 不是单调累积——模型变强会让一部分 Harness 过时。"删 Harness"是与"加 Harness"并行的能力,与传统软件"功能只增不删"惯性方向相反。操作性反例:Anthropic 内部合并代码必须过 Claude 审查(早期不准到 4.5/4.6 才达可靠水平 → 从可选变强制门控)——删旧能力 + 加新门控同时发生才能让 Harness 与模型能力对齐 → 与 harness-engineering 的连接:在该页"反向印证 vibe coding"段之前新增"'删 Harness'与'加 Harness'并行:Anthropic 的模型升级习惯"整段;与 agent-tool-design 的连接:相关概念加 research-preview-pattern + 注"工具集设计的'减法'维度"
-
让模型自我反思是 Harness 改进方法论 — Kat 发现模型改完前端代码会跑测试但不打开页面看 UI,问模型为什么 → "system prompt 里某段话让它困惑" / "委派给 sub-agent 但没检查"。"对模型的决策保持好奇心,问它为什么做出那个选择,你就能看到是什么误导了它,然后修复。"给 Harness 设计补一条新原则:模型自己是 Harness 缺陷的最佳报告者——把 Harness 改进做成"问模型为什么"的循环 → 与 harness-engineering 的连接:在该页新增"让模型自我反思:Harness 改进的方法论"整段;与 decision-execution-decoupling 的连接:让模型反思是把 Decision 与 Execution 之间"为什么这样决策"显式化——在 OTA 循环外加一个"反思"半步
-
"95% 不是真正的自动化"反向补强 CREAO 95% 操作定义 — Kat:"如果一个自动化不能 100% 工作,那它就不是真正的自动化。最后那 5% 确实需要更多时间。"两个判断不冲突,覆盖不同时点:CREAO 95% 是起步门槛(团队整体 AI 化率达到才叫 AI-first)+ Anthropic 100% 是单流程的合格线(任一被自动化的流程必须做到完全可靠才算"已自动化")。Kat 观察到三种最常见失败:从不自动化 / 沉迷工具配置 / 95% 后放弃。她自己用 Cowork 做 Gmail 收件箱清零未到 100% → 与 ai-first-engineering 的连接:在该页"95% 操作定义"段新增"Anthropic 视角的反向补强"子段,含两个判断的时点对照 + Kat 三种失败模式 + Sentino 应用建议"用 Kat 标准复审已用 AI 的工作流——是否任一流程做到了 100%"
-
工程师 PM 融合给 CREAO "架构师 vs 操作员" 加 Anthropic 视角 — Kat:"代码变得越来越便宜了。那什么变得更有价值呢?决定写什么。"Anthropic 招产品品味的工程师而非传统 PM。典型流程:工程师从社交媒体反馈开始 → 周末自己上线功能。与 CREAO 框架的对照:CREAO 是新组织从头设计;Anthropic 是头部公司主动改造已有 PM 角色。副作用警示:融合带来产品一致性问题——同一需求两个功能在做。Anthropic 取舍是接受代价(提供
/powerup教程),不为消除冗余而放慢 → 与 ai-first-engineering 的连接:在该页新增"工程师 PM 融合:Anthropic 头部组织样本"整段,含与"架构师 vs 操作员"对照 + Sentino 应用判断(产品和工程紧密协作如子昕跟工程师每周工作 1-2 天,不必从头重构组织)+ 副作用警示(功能爆炸 + 内部对齐损耗在客户量未起量阶段更难承受) -
Cowork 实际用例对 Sentino 客户对接环节有直接参考价值 — Kat 自己用 Cowork:连接 Calendar/Slack/Gmail/Drive + 告知主题 + 1 小时生成 20 页 Code with Claude 大会演讲稿。Applied AI 团队用 Cowork 在客户会议前自动生成 briefing(客户身份 / 以往问题 / 待办事项 / 功能发布时间)。Kat 的产品分类:输出代码 → Claude Code / 输出非代码内容 → Cowork → 与 sentino-agent 的连接:在该页相关概念加 research-preview-pattern + 注"Cowork 给客户 briefing 自动生成的用例对 sentino-tenga / yukai-agora-poc / hotmind-client 客户对接环节有直接参考价值"
更新页面¶
concepts/harness-engineering— 新增"'删 Harness'与'加 Harness'并行:Anthropic 的模型升级习惯"整段 + "让模型自我反思:Harness 改进的方法论"整段;相关概念加 research-preview-pattern;sources 加新 rawconcepts/ai-first-engineering— "95% 操作定义"段新增"Anthropic 视角的反向补强:'95% 不是真正的自动化'"子段 + 新增"工程师 PM 融合:Anthropic 头部组织样本"整段;相关概念加 research-preview-pattern;sources 加新 rawconcepts/pivot-speed-as-moat— 相关概念加 research-preview-pattern + 注 Anthropic 第三独立样本(CREAO + Cursor 之后)concepts/platform-layer-collapse— 相关概念加 research-preview-pattern + 注 OpenClaw 停服 + 优先第一方 = 平台层坍缩具体执行(含 credits 缓冲过渡)concepts/claude-agent-sdk— 相关概念加 research-preview-pattern + 注"Anthropic Kat Wu 视角的产品演进路线图(单任务 → 多任务 → 50-几百并行),SDK 是该演进的基础设施层"concepts/agent-runtime-architecture— 相关概念加 research-preview-pattern + 注 PM 三阶段产品演进 + 删功能习惯对 Layer 1 启动层 system prompt 设计的具体含义concepts/agent-tool-design— 相关概念加 research-preview-pattern + 注"删功能 / 模型升级响应是工具集设计的'减法'维度"projects/sentino-agent— 相关概念加 research-preview-pattern + 注 Cowork 客户 briefing 用例对 Sentino 横向客户线对接价值wiki/index.md— Agent 框架与架构子分区末尾加 research-preview-pattern;最近更新加一条 2026-04-27
事实核查记录¶
- "OpenClaw 应用停服" → ~~搜狐转载术语映射存疑~~ 2026-04-27 用户澄清 + WebSearch 核实后已修正:事件实质是 2026-04-04 Anthropic 撤销第三方 agentic 工具走 Claude subscription OAuth 的能力(OpenClaw 框架本身仍可运行,用户自带 API key 即可继续)。详见 platform-layer-collapse "新坍缩工具:上游撤 OAuth piggyback"段。AGIHunt 原文措辞不准,但事件本身真实重要——已升级为 platform-layer-collapse 主章节内容
- Lenny Rachitsky 播客 / Kat Wu / Boris 身份 → 因网络层证书故障未跑 WebFetch 独立核实 Lenny's Newsletter 原始 episode + Kat 在 Anthropic 角色,按素材原文标注;下次 ingest 如有机会回头补独立核实
- "40 天发布 30+ 项功能" / "6 个月→1 天发版" / "/powerup 内置教程" / "Code with Claude 大会"等具体数字与产品名 → 都来自 AGIHunt 转载,未独立核实 Anthropic 官方对应公告;wiki 用作 Kat 个人陈述的标注引用,不替"Anthropic 官方"背书
- "源码泄露事件 + 处理文化(流程问题非个人惩罚)" → wiki 未单独抽段——是 Anthropic 文化点而非可推广概念,留在 raw 即可
- 客户文档陷阱检查:本素材是 Lenny 播客访谈 + 媒体二次报道,不是客户向 PRD/RFP/提案/合同,不触发该专项检查
- 作者身份警示:Kat Wu 是 Anthropic 在职 PM,所有"Anthropic 内部如何做"的陈述都是利益相关方表述——不是客观第三方。本知识库已在多处明确标注"Kat 视角""Anthropic 视角",避免混淆为业界客观判断
待办¶
- 网络层稳定后回 WebFetch 核实 Lenny's Newsletter 原始 episode + Anthropic 官方对"40 天 30+ 功能" / "6 个月→1 天"等数字的对应公告,回 research-preview-pattern 事实核查段
- ~~"OpenClaw 应用停服" 究竟指什么产品~~ 已澄清(2026-04-27 用户澄清 + WebSearch 核实):事件实质是 Anthropic 撤销 third-party harness OAuth piggyback,OpenClaw 框架本身在跑。修正已落到 platform-layer-collapse / harness-engineering / ai-agent-moats 三页 + raw notes 转译注释段
- Sentino 是否引入 Research Preview 三机制(Sentino 优先级判断:先采纳 Research Preview→低成本最高 ROI,观察客户反馈后再决定是否推 Launch Room 与工程师 PM 融合)?这是产品决策建议而非已落地行动,留待与 Chris/子昕讨论后再回 research-preview-pattern 页 Sentino 应用段更新
- Anthropic 千人规模下"工程师周末上线功能"是否只代表少数顶尖工程师而非全员?需要更多内部样本验证,回 research-preview-pattern 待观察段
- Kat 三阶段产品演进路线图(单任务 → 多任务 → 50-几百并行)是否在 2026 下半年的 Anthropic 产品发布中体现?追踪 Claude Code / Cowork 实际功能演进,回 claude-agent-sdk 页加印证段
- "100% 自动化"反向补强 CREAO 95% 操作定义之后,Sentino 是否有具体流程做到了 100%?这是 ai-first-engineering 页 Sentino 应用段的待答问题
OpenClaw 事件 fact correction(同日追加,第三节)¶
触发:用户读 Kat Wu ingest 后澄清——"OpenClaw 应用停服"的实际指代是"Anthropic 撤销 OpenClaw 通过 Claude 订阅 API 的 access"。WebSearch 进一步核实事件细节、经济学机制、行业 pattern。
结论:事件不是术语翻译问题,是知识库结构性升级——从 research-preview-pattern 一个隐喻性引用升级为 platform-layer-collapse 一个独立章节 + harness-engineering Cache 经济学条目实证 + ai-agent-moats 数据飞轮护城河补强。
事件事实链(WebSearch 2026-04-27 核实)¶
| 时间 | 事件 |
|---|---|
| 2025-11 | Peter Steinberger 发布 Clawdbot,后改名 OpenClaw,开源 agent 框架 |
| 2026-02 | Steinberger 加入 OpenAI |
| 2026-02-20 | Anthropic 法律条款明确禁止 subscription OAuth tokens 用于第三方工具 |
| 2026-02~03 | 服务端静默部署 OAuth token 拦截 |
| 2026-04-04 12:00 PT | 政策正式执行——Claude Free/Pro/Max 订阅不再覆盖第三方 agentic 工具 |
| 2026-04-10 左右 | Steinberger 公开抱怨 + 账号被以"suspicious"暂停 → 病毒式传播 → 几小时后恢复 |
| 后续 | OpenClaw-style Claude CLI usage(如 claude -p)被允许 |
关键事实(之前 wiki 错的 / 缺的)¶
- 不是"OpenClaw 应用停服"——OpenClaw 仍可运行:用户自带 API key 走 pay-as-you-go 即可继续用
- 经济学具体:单 instance/天可耗 $1,000–$5,000 API 等价;$200 Max 订阅 = 5–10x 套利;135K instances 在跑——规模级 cross-subsidy 不可持续
- 政策范围:Boris Cherny X 表态"applies to all third-party harnesses"——不是单点针对 OpenClaw
- 第一方 vs 第三方有结构性 cache 优势:Anthropic 第一方工具优化 prompt cache hit rate,第三方工具绕过缓存——这是 harness-engineering "Cache 经济学是架构约束"判断的实证
- Google 2026-02 已先做同样事情:Antigravity / Gemini CLI / Gemini Code Assist 同样禁止第三方 OAuth piggyback——这是行业级 pattern,不是 Anthropic 个案
- 行业意义:从 flat-rate 订阅向 usage-based 计费的全行业转向
修正落地(4 个文件 + raw notes)¶
raw/notes/anthropic-kat-wu-pm-shipping-cadence-2026-04-25.md— 重写"OpenClaw 政策"段,加完整时间线 + 经济学 + 行业 pattern + 来源链接 + Boris Cherny 原话;修正"转译注释"段concepts/platform-layer-collapse— 新增"新坍缩工具:上游撤 OAuth piggyback(2026-04 OpenClaw 案例)"整章节:含事件事实、经济学(5–10x 套利 + 135K instances)、不是 Anthropic 个案(Google 2026-02 先例)、对中间层 agent 框架含义、对 Sentino 含义。同时修正 research-preview-pattern 引用行措辞concepts/harness-engineering— "Cache 经济学是架构约束"那一条加 OpenClaw 政策实证回连concepts/ai-agent-moats— "数据飞轮"段加"第一方 vs 第三方 cache 经济学是结构性护城河"补强段wiki/journal/2026-04-27.md— 事实核查段标注修正 + 待办段标注 ✓ 已澄清 + 本节新增
元观察(关于知识库工作流)¶
- 用户澄清的价值:用户一句"OpenClaw 应用停服 是指 claude 停止 OpenClaw 使用 claude app 的订阅 api"触发了三个新的连接(cache 经济学护城河 + 上游政策权力 + 行业 pattern),这是 ingest 当下漏掉的结构性洞察。人类 + Claude 的反馈环比纯 Claude 单次摄取 + lint 更能发现遗漏
- WebSearch 二次核实的价值:用户澄清虽对,但 WebSearch 把事件升级为有完整时间线 + 数字 + 行业 pattern 的可引用单元。仅靠用户口头澄清不够支撑 wiki 升级——必须有可引用的来源链
- 平台层坍缩工具集扩展:原本 wiki 假设坍缩主要是"出新产品吃中间层"。OpenClaw 案例展示了上游通过控制 OAuth/API access 的政策权力——这是更基础的层级权力,不需要新产品就能改变中间层经济。下次摄取类似行业事件时优先看是否有"上游政策动作"维度
- 2 个证据点尚不够独立成页:考虑过新建
concepts/subscription-vs-api-pricing-bifurcation,但目前只有 Anthropic + Google 2 个证据点,作为 platform-layer-collapse 段更稳妥。等 OpenAI / DeepSeek / Mistral 等第三方厂商跟进时再独立
后续待观察¶
- OpenAI / DeepSeek / Mistral / xAI 等其他 LLM 厂商是否在 2026-Q3 跟进同样的 third-party OAuth piggyback ban?如果 ≥3 家跟进,应独立成页
concepts/third-party-harness-policy或类似 - Anthropic 是否会进一步收紧——例如限制 SDK 调用频次、限制特定 prompt cache 模式、或对自家 Claude Code 子用户也做配额?追踪政策演进,回 platform-layer-collapse 段补条
- 中间层 agent 框架如 OpenCode / OpenCode-CLI / Aider 等是否会因这条政策快速换 backend(DeepSeek / Qwen / Kimi)?这是 model-hardware-decoupling "切 backend 是中间层对冲"判断的实证机会
- Sentino 是否有任何 standalone agent 或 client 走 Claude OAuth piggyback 模式?应该没有(Sentino 是 API 直付客户),但值得在下次 Standalone Agent 架构 review 时确认
摄取 RootSwarm.ai 战略推演(Gemini 对话精简版,第四节)¶
来源:raw/notes/rootswarm-strategy-brainstorm-2026-04-27.md(Gemini chat export 2026-04-27 15:23,原 38 轮 / 76 messages / ~75K tokens 经 5x 压缩为 248 行 raw 沉淀。原对话由用户读完 Kat Wu 文章后触发,做 sideproject RootSwarm.ai 的战略推演)
说明:raw 内容主要是 sideproject 私有战略,不全部入 wiki——只抽两个真正强的行业级洞察落地(用户拍板 Option 3)。
新建页面(1 页)¶
concepts/agent-creator-refiner-operator— Agent 三元论:Creator(熵增/卖创造力/被模型公司必吃)/ Refiner(熵减/卖确定性/沙里淘金)/ Operator(State Alteration/卖现实动作/不可逆)的 MECE 分类。含三类物理机制对比 + Creator 脆弱性 + Refiner+Operator 三道护城河(Integration Moat / Liability Wall / Private State Machine)+ 与已有 wiki 多页对应关系 + RootSwarm 案例(2+3 锁定)+ Sentino Standalone Agent 诊断(当前 Refiner 为主,Operator 弱)+ 与 amphiflow 协同表
关键知识提取¶
-
Agent 三元论是 MECE 分类轴:按"agent 输出后世界发生了什么"切分 —— Creator(多了数字资产)/ Refiner(多了结构化秩序)/ Operator(外部状态不可逆变化)。三类彼此独立、共同穷尽。任何 agent 行为属于这三类之一或多类组合 → 与 agent-creator-refiner-operator 的连接:本概念页就是为承接这条 MECE 分类而抽出的;与多个已有页(agent-tool-design / claude-agent-sdk / palantir-ontology)形成"三类各自代表"对应关系,是后续 agent 讨论的"原子词"
-
Creator 是模型公司必吃赛道,纯 Creator 创业 = 在火山口建房子:Anthropic 的 Claude Code → Cowork → Computer Use 路径 / OpenAI Codex → VS Code 一键集成 / Google Antigravity IDE 都在收割 Creator。下一代旗舰模型发布时,纯 Creator 类创业护城河瞬间灰飞烟灭——这是 platform-layer-collapse 的核心动力 → 与 platform-layer-collapse / claude-agent-sdk 的连接:在两页相关概念加 agent-creator-refiner-operator + 注 "Creator 是模型公司必吃赛道"
-
Refiner+Operator 结合体的三道结构性护城河: - Integration Moat(脏活累活的工程泥沼):模型公司只做标准 API,Refiner+Operator 全是非标脏活——千奇百怪的只读接口、易崩溃爬虫、网站登录校验、反爬机制 - Liability Wall(法律责任墙):模型公司极度害怕承担现实世界法律风险(自家 agent 替转账出错 → 天价集体诉讼),所以主动加 Safety Guardrails;第三方应用通过"agent 拟定草稿 + 人类一键确认"模式把责任还给用户 - Private State Machine(私有状态壁垒):Refiner+Operator 强依赖私有银行流水/日历/邮件——这些不属于大模型训练集 → 与 ai-agent-moats 的连接:在该页相关概念加 agent-creator-refiner-operator + 注 "三道结构性护城河,是中间层创业绕开模型公司重力场的具体路径"
-
Palantir AIP 是 Refiner 类企业级重装甲;留下"动态 + 轻量"市场未被覆盖:Palantir AIP 占住"静态 + 重装甲"位置(FDE 驻场 + 客单 $1M+ + 多年合同 + 持久 Ontology)后,留下了完整的"动态 + 轻量"赛道(用户自助 + API 按需 + outcome-based 定价 + 即用即走)。"Palantir for the rest of us"——用户不部署本地数据库,扔给系统 500 个杂乱网页,10 分钟后吐出干净 Excel,做完销毁 → 与 palantir-ontology 的连接:在该页"对 Sentino 的启示"段之前新增"静态 vs 动态结构化引擎对照"整段,含对照表 + "Palantir for the rest of us" 类比 + 留出的市场空间判断
-
三元论 + amphiflow 正交可叠加:amphiflow(默认 workflow + agent 兜底)解决"决策怎么产生"——LLM vs 代码。三元论解决"agent 在系统中扮演什么角色"。Operator 类应用最适合 amphiflow 模式——不可逆错误代价高 → 默认 workflow + agent 兜底 + Human-in-the-loop 三层保障是必然架构 → 与 amphiflow-pattern 的连接:在该页相关概念加 agent-creator-refiner-operator + 注"Operator 类应用最适合 amphiflow"
-
Sentino Standalone Agent 当前是 Refiner 形态,Operator 能力较弱:按三元论给 Sentino 做诊断——主 Agent 通过 read_xx 读 standalone agent latest 是 Refiner(把用户散落数据收敛成 latest),但当前未真正发起外部世界动作。潜在演进方向:未来给客户卖"AI 替我办事"价值时需补强 Operator 能力,与 amphiflow workflow 兜底架构天然契合;但 Liability Wall 风险需前置考虑(客户文档陷阱 / 医疗合规 / 性健康内容审核责任归属) → 与 sentino-agent 的连接:在该页相关概念加 agent-creator-refiner-operator + 完整诊断(当前形态 + 演进方向 + Liability Wall 警示)
更新页面¶
concepts/palantir-ontology— 新增"静态 vs 动态结构化引擎对照"整段(对照表 + Palantir for the rest of us 类比 + 留出市场空间判断);相关概念加 agent-creator-refiner-operator;sources 加 RootSwarm raw;updated → 2026-04-27concepts/platform-layer-collapse— 相关概念加 agent-creator-refiner-operator + 注"Creator 是模型公司必吃赛道,Refiner+Operator 是中间层真正生存空间"concepts/ai-agent-moats— 相关概念加 agent-creator-refiner-operator + 注"Refiner+Operator 三道结构性护城河"concepts/agent-tool-design— 相关概念加 agent-creator-refiner-operator + 注"工具设计哲学按三类 agent 有不同侧重"concepts/claude-agent-sdk— 相关概念加 agent-creator-refiner-operator + 注"Claude Code SDK 主要承载 Creator 类应用——纯套壳创业要慎重"concepts/decision-execution-decoupling— 相关概念加 agent-creator-refiner-operator + 注"DED 是 agent 内部架构原则,三元论是 agent 外部角色分类,两个维度正交"concepts/amphiflow-pattern— 相关概念加 agent-creator-refiner-operator + 注"Operator 类应用最适合 amphiflow 模式"concepts/process-data-vs-output-data— 相关概念加 agent-creator-refiner-operator + 注"过程数据是 Refiner 类输入原料、Operator 类执行依据;2+3 战略本质是'在过程数据上立足'"concepts/ai-first-engineering— 相关概念加 agent-creator-refiner-operator + 注"CREAO Coding Agent 是 Creator 元工具;与三元论 2+3 战略形成张力——CREAO 主张让 agent 现写代码扩展长尾,三元论主张避开 Creator"projects/sentino-agent— 相关概念加 agent-creator-refiner-operator + 完整诊断(Standalone Agent 当前 Refiner 为主 / Operator 演进方向 / Liability Wall 警示)wiki/index.md— Agent 框架与架构子分区末尾加 agent-creator-refiner-operator;最近更新加一条 2026-04-27
事实核查记录¶
- 来源属性显式标注:Agent 三元论是用户与 Gemini 在 RootSwarm 战略推演中协同提出——用户先提"Creator vs Refiner"二分 → Gemini 补 Operator → 用户判断"应该锁定 2+3"。本知识库不替"独创"声明背书,但分类框架本身的 MECE 性质和与已有 wiki 的对应关系是经过推演验证的
- 不入 wiki 的部分:raw 文件包含 Stripe Chargeback Defender MVP 业务逻辑、月入 1 万美元数学题、Reddit GTM 路径、桌面端 Option+Space UX 等 RootSwarm 私有战略——这些是 sideproject 文档级别,不污染 wiki
- C 端 Agent 四原则(消除具体摩擦 / Zero-Data-Entry / Graceful Degradation / 日常蓄水节点爆发)暂不抽——只有 1 个证据点(单次 Gemini 推演),等遇到第二个独立来源(实际产品案例 / 行业访谈)再考虑
- "美国人日常痛点"列表(医疗账单 / 信用分 / HOA)暂不入 wiki——Gemini 单源建议,无外部数据支撑
- 客户文档陷阱检查:本素材是用户与 Gemini 的私人对话 + sideproject 推演,不是客户向 PRD/RFP/提案/合同,不触发该专项检查
待办¶
- 第三个独立证据点出现后是否需要扩展为四元论?例如 Curator(精选/推荐型)——TikTok 推荐 / Spotify 歌单。当前直觉是 Curator 是 Refiner 子类("从全网收敛到 top 10"),不需独立。追踪 2026 下半年是否有新 agent 类型实证
- Operator 类应用的法律责任框架在 2026 是否会成形?参考 work-experience-ownership 法律真空判断——Operator 比 Refiner 责任问题更严重,第一个判例可能改变整个赛道生态。回 agent-creator-refiner-operator 待观察段
- Sentino Standalone Agent v2 阶段是否引入 Operator 强化?需要在产品决策时回 sentino-agent 页"Amphiflow 视角的 Standalone Agent v2 评估"段叠加三元论视角 + Liability Wall 评估
- C 端 Agent 四原则等第二个独立证据点出现后再考虑独立成页
- Sentino 是否有客户场景适合 RootSwarm 类"动态 + 轻量 Refiner"?例如 sentino-tenga 的"客户问诊数据 → 结构化健康档案"或 yukai-agora-poc 的"用户对话 → 性格图谱"——值得在下次客户线 review 时按三元论重新审视
- RootSwarm.ai 后续如果实际开发,可作为 Sentino 团队成员 sideproject 的具体范例 → 验证 research-preview-pattern "工程师 PM 融合"在小团队的可行性
新建研究报告:Agent 三元论独立验证(第五节)¶
触发:用户在 ingest Agent 三元论(commit e06db55)落地后立即追问"Agent 三元论验证与分析"——对自己刚提出的概念主动求挑战,是 idea-meritocracy "极度求真 + 压力测试 + 反谄媚"原则的体现。
报告地址:2026-04-27-agent-trichotomy-validation
报告摘要¶
- 学术分类核对:核查 6 个学术分类法(Russell & Norvig 5 类 / arXiv 2601.12560 6 维 / AI Agents vs Agentic AI 3 阶段 / AAGMM 5 级 / INSYTE+ALFUS 多维 / OECD 政策视角)—— 没有完全等同 MECE 分类,已有分类全部按内部维度(架构 / 自治 / 治理)切分,三元论占独特"按输出后世界发生什么"切分轴,与已有分类是正交补充关系
- 15 产品反向测试 MECE 性:Cursor / Claude Code / Devin / Manus / Computer Use / Doxis ECM / Klippa / Azure Document AI / Stripe Sigma AI / BeamAI / Sierra / Glean / Harvey AI / Salesforce Agentforce / GitHub Copilot Workspace 全部能干净归类(含组合);唯一盲点:Conversational Companion / Personal Assistant 类(Clawdbot / Moltbot 类)—— 核心价值在对话过程本身而非输出形态
- 盲点处理判断:不扩展四元论,加边界说明——加 Conversational Companion 作为第 4 类会破坏 MECE 性(其他三类按"输出形态"切,第 4 类按"价值在过程"切,两个不同分类轴混合不再 MECE)。建议 Conversational Companion 类应换 seal-architecture / voice-presence 框架评估
- 反例验证 Operator 风险判断:Devin 官方 13.86% 成功率 + Manus 用户被 drained without warning 两个真实案例精确印证三元论"Operator 容错率不可逆 + Liability Wall 风险"判断——这把推演级判断升级为产品级证据
- Plan-and-Execute 模式(Google Agent Bake-Off 2025)作为 2+3 战略行业实证:Google 内部 4 个 agent 项目集体收敛得到的工程经验"Let the AI do the thinking, but let your traditional code do the doing"——三元论 2+3 战略不是单次 RootSwarm 推演孤立产物,是头部公司同向收敛的工程共识
落地修正(4 段加在 agent-creator-refiner-operator)¶
- "适用边界"段补一条具体边界:"不适用 Conversational Companion / Personal Assistant 类"
- 新增"与学术分类法的正交关系"段——含 6+ 个学术分类对照表 + 正交关系判断
- 新增"Plan-and-Execute 模式:Refiner+Operator 工程分离的行业实证"段——含 Google Agent Bake-Off 原文引用 + Multi-agent Refiner+Validator+Operator 三段式分工
- 新增"Devin / Manus 反例:Operator 不可逆判断的产品级证据"段——含 13.86% 成功率 + drained without warning 两个反例 + 印证三元论判断 - 末尾加"完整研究链路:→ 2026-04-27-agent-trichotomy-validation"回连 - frontmatter sources 加 Google Agent Bake-Off + arXiv 2601.12560 两个独立来源
元观察¶
- Reports 类型的第二次实战:2026-04-24-deepseek-v4-6.1-tflop-gbps-deep-dive 是用户追问"6.1 TFLOP/GBps 论点深化"触发;本次是用户追问"Agent 三元论验证与分析"触发——两次都是用户对自己刚 ingest 的内容主动求挑战。这种 "ingest → 立即验证" 的反馈环是 reports/ 类型的天然适用场景
- WebSearch 的局限:本次调研覆盖了 2026 头部学术与行业内容,但未深入追溯 2024-2025 的 LLM agent paradigm 论文。如果有更早的 MECE 分类先例存在,本报告可能漏报——已写入待办段
- 三元论的真正贡献不在分类法本身,在切分维度的明确性 + 可操作判断:三元论的"创新点"不是学术意义上的新框架,是把"按输出后世界发生什么"这条已存在的隐性切分维度显式 MECE 化 + 提取出"Refiner+Operator 三道护城河"等可执行战略
- 报告对原 concept 页的反向反哺验证 wiki 工作流:本次 reports/ → concept/ 修正 4 段,是 2026-04-24-deepseek-v4-6.1-tflop-gbps-deep-dive 模式的复用——report 不只是孤立产物,还是 concept 页的"压力测试 + 升级"机制
拒收虚假 Walmart "RetailForge" 营销稿 + 摄取真实 Walmart 战略(第六节)¶
触发:用户粘贴一篇标题《重磅发布: Walmart 用 AI 代理提升销售转化率 30% / Walmart RetailForge 重磅发布》的"零售 agent 平台"营销稿。WebSearch 二次核实发现"RetailForge Agent" / "RetailForge"在 Walmart 公开材料里完全不存在——是 AI 生成的虚假营销稿(混合真实公司名 + 杜撰产品名 + 不可核实数字)。
处理决策:拒收原素材,但 WebSearch 同时挖出 Walmart 真实的 agentic AI 战略——基于真实材料 ingest。
虚假素材识别记录(元数据沉淀)¶
典型 AI 生成虚假营销稿特征清单(写入 raw 元数据段供未来识别): 1. 杜撰产品名 + 真实公司(增加表面可信度) 2. 真实关键词混合(agent / 闭环 / 个性化推荐 / 双碳) 3. 数字过于完美(+30%、+29% 这种整数对) 4. 多国试点叙事但无具体门店名 5. 无具体发布日期 + 无第一手来源 + 无具体高管姓名
→ 与 ai-vendor-spec-traps 同源方法论。
新建文件(1 个 raw)¶
raw/notes/walmart-agentic-ai-strategy-2026-04-27.md— 含虚假素材识别记录(元数据)+ Walmart 真实 agentic AI 战略(4 个 super agents + Wally Self-Healing Inventory + UCP + Sparky Sponsored Prompts)+ 与已有 wiki 的连接 + 完整来源链接(11 个外部来源)
更新页面(4 页)¶
concepts/agent-creator-refiner-operator— 新增"Walmart Wally + Self-Healing Inventory:Refiner+Operator 企业级实证"段,含三档案例对照表(Palantir 重装甲 / Walmart 企业级 / RootSwarm 轻量)+ 与 research-preview-pattern multi-agent 路线图呼应;sources 加新 rawconcepts/mcp-protocol— 新增"垂直扩展实证:Universal Commerce Protocol(UCP,2026-01)"整段,含 UCP-MCP-A2A-AP2 协议层级表 + 合作方阵容(含 WooCommerce 缺席)+ 对 MCP 生态成熟度的含义 + Sentino 借鉴方向;相关概念加 agent-creator-refiner-operator;sources 加新 rawconcepts/ai-agent-moats— 相关概念加 Sparky Sponsored Prompts 作为新商业模式信号(AI agent 内置广告 + 平台抽成是模型公司不会做但零售平台天然能做的差异化)concepts/platform-layer-collapse— 相关概念加 Walmart 大企业垂直整合自建实证作为反向坍缩信号wiki/index.md— 最近更新加一条 2026-04-27
关键知识提取¶
-
Wally + Self-Healing Inventory 是企业级 Refiner+Operator 实证,$55M 节省数字真实:Walmart Corporate 2025-07-17 公告原话 "This technology has already saved Walmart more than $55 million"——重点品类 volatile perishables / 具体场景 Mexico City + Coyol。这给三元论 2+3 战略加了一个企业级垂直整合实证,与已有的 Palantir AIP(重装甲)+ RootSwarm(轻量)形成完整产品光谱 → 与 agent-creator-refiner-operator 的连接:在该页加"Walmart Wally + Self-Healing"段 + 三档案例对照表
-
UCP 是 MCP 生态成熟度的标志性事件:Google 2026-01-11 NRF 公布 + 2026-04-08 v2026-04-08 + 兼容 MCP/A2A/AP2 + 20+ 全球合作方。UCP 不是替代 MCP,是兼容 MCP 之上加 commerce 垂直 schemas——证明 MCP 已成"开放 agent 协议"基础层 → 与 mcp-protocol 的连接:在该页 "2026 展望" 段后新增独立章节"垂直扩展实证:UCP",含协议层级表
-
WooCommerce 缺席 UCP 值得关注:占全球 43.4% 网站的 WordPress 系电商插件未参与 UCP,agentic commerce 长尾市场命运待观察——可能形成"大零售商 + 平台 SaaS(Shopify)享受 agentic commerce / SMB / 自建网站被边缘化"的两极分化 → 待观察:WooCommerce 是否会被纳入 UCP 或推自家协议?
-
Sparky Sponsored Prompts 是 AI agent 商业模式新形态:在 conversational shopping flows 里嵌入广告("Sponsored Prompts")。零售/分发平台天然能做但模型公司(Anthropic / OpenAI)不会做——AI agent 商业模式正在多元分化而非收敛:模型公司 token + outcome-based / 零售平台 agent 内置广告 + 抽成 / 企业 SaaS outcome-based + 私有数据复利 → 与 ai-agent-moats 的连接:相关概念加 Sparky Sponsored Prompts 一行
-
Walmart 同时在三层下注:UCP 早期合作方(公开外卖)+ 内部 Wally super agents 用 Microsoft Azure OpenAI(私有)+ 与 Google Gemini 合作做 Agentic Commerce(开放)—— 零售巨头的 multi-agent 布局是开放协议生态的最大客户之一 → 与 platform-layer-collapse 的连接:大企业垂直整合自建是中间层 agent 应用的反向坍缩信号
-
元方法论:虚假素材识别的 5 条特征清单:杜撰产品名 + 真实关键词混合 + 数字过于完美 + 试点无具体门店名 + 无具体高管/日期/来源——这是知识库工作流的元数据沉淀,比单次素材本身更有长期价值
事实核查记录¶
- "Walmart RetailForge Agent" / "RetailForge" → WebSearch 完全不存在,确认是虚构产品
- "+30% 销售转化率 / +29% 库存周转率 / 美国-中国-德国试点" → 完全不可核实,wiki 完全不基于这些数字做任何陈述
- "Walmart OS" → marketing 杜撰,Walmart 实际后端用 Microsoft Azure OpenAI(super agents)+ Google Gemini(Agentic Commerce)
- Wally 名称 + 功能 → ✅ Walmart Corporate 2025-07-17 公告 + Grocery Dive 2025-03 双独立来源核实
- $55M Self-Healing Inventory 节省数字 → ✅ Walmart Corporate 2025-07-17 公告原文核实
- UCP 公布时间 + 合作方阵容 + 技术架构 → ✅ Google Developers Blog + Shopify Engineering + ucp.dev + TechCrunch 多源核实
- Sparky Sponsored Prompts → ✅ PYMNTS 2026 报道核实,2025-11 静默测试 + 2026 正式上线
- 客户文档陷阱检查:本素材不是客户向 PRD/RFP/提案/合同,不触发该专项检查
待办¶
- WooCommerce 是否会被纳入 UCP 或推自家协议?决定 agentic commerce 长尾市场的命运,回 mcp-protocol 待观察段
- Sparky Sponsored Prompts 转化率/广告主满意度真实数据何时披露?目前只有定性描述
- Wally Self-Healing Inventory $55M 数字会不会随时间继续累积公布?2026 年底新数字可以追踪 agentic AI 在零售供应链 ROI 真实增长曲线
- UCP v2026-04-08 之后版本演进(特别是与 MCP/A2A/AP2 边界协调)—— 决定开放 agent 协议生态会收敛还是分裂
- 中国零售(拼多多/阿里/京东)是否会推自家版 UCP 或对接 Google UCP?这是 asymmetric-chokepoints 在 commerce 协议层的潜在博弈点
- 类似的 AI 生成虚假营销稿如果再出现,重新触发"识别清单"测试——验证 5 条特征是否够用,缺什么特征可以补
fact-fix: Sentino 团队角色更新(CEO 变更)¶
事实:Lawrence 接任 CEO;Chris 转董事长。子昕(产品)/ 姜涛(技术负责人)不变。
改动:
- wiki/projects/sentino-agent.md "六边形战士角色评估" 段——Chris(CEO) → Lawrence(CEO) + Chris(董事长) 双角色拆分;六边形战士论述同步调整为"两人各承担不同维度"
- ~/.claude/projects/-Users-momo-obs/memory/project_sentino_team.md——更新角色表,保留 "Chris 曾任 CEO" 历史脚注,避免回看旧 ingest(如 TENGA / OpenClaw 讨论)时混淆发言权重
Why:用户 2026-04-27 在 SENTINO_BLUEPRINT v2 协作中告知。读群聊/历史 ingest 时若把 Chris 仍当 CEO 处理,会错估当前发言权重和决策路径。
未做:原 raw notes 与 journal 中历史出现的 "Chris(CEO)" 表述不回溯改写——它们是当时事实的快照,回溯改写会破坏时间维度的可信度。
摄取 Anthropic 4-23 博客《Building agents that reach production systems with MCP》¶
触发:用户粘贴 sohu / AGIHunt 中文转载(https://www.sohu.com/a/1013512394_122189055)。WebSearch 二次核实直接锁定 Anthropic 官方原文(claude.com/blog/building-agents-that-reach-production-systems-with-mcp)+ ScaleKit 一手开源 benchmark(github.com/scalekit-inc/mcp-vs-cli-benchmark)。
素材来源核查:AGIHunt 此前出现过术语映射不严谨问题(Kat Wu ingest 时"OpenClaw 应用停服"措辞不准)。本次 AGIHunt 整体准确,但有一处数字混淆(72% 实际是两个独立来源——ScaleKit reliability 72% + Apideck context 72%)。wiki 按一手来源准确分开标注。
新建文件(1 个 raw)¶
raw/notes/anthropic-mcp-production-agents-blog-2026-04-23.md— 含 Anthropic 官方原文要点 + ScaleKit benchmark 一手数据 + 演进事件链 + AGIHunt 中文解读 vs 一手原文差异表 + 14 个外部来源链接
更新页面(3 页)¶
concepts/mcp-protocol— 大幅升级:(1) 生态规模段升级 SDK 月下载 9700 万 → 3 亿(Anthropic 4-23 官方原文),(2) 新增"2026-Q1 社区批评 + ScaleKit Benchmark + Anthropic 4-23 官方回应"完整章节(含 ScaleKit 75 轮一手数据 + Tool Search 85% + Programmatic Calling 37% + Cloudflare 2 工具案例 + MCP+CLI+API 三条路最终分工 + MCP+Skills 配套实证 + 完整事件链时间线);sources 加新 rawconcepts/platform-layer-collapse— 相关概念加 "Anthropic 4-23 博客的反向叙事修正" 段,把 OpenClaw 事件 + Anthropic 4-23 官方反击连成完整叙事concepts/agent-tool-design— 相关概念加 "工具按意图分组不按 API 分" 设计原则升级(Tool Search 机制的前提)+ Cloudflare 2 工具极端实证
关键知识提取¶
-
MCP SDK 月下载数 1 亿 → 3 亿(4 个月翻 3 倍) — Anthropic 4-23 官方博客原文:"The MCP SDKs recently surpassed 300 million downloads a month, up from 100 million at the start of the year"。这是 mcp-protocol 之前 wiki 写的 9700 万的直接升级 → 与 mcp-protocol 的连接:升级生态规模段
-
ScaleKit 一手 benchmark 数据:CLI 32x 便宜 + 17x 月成本 + 72% vs 100% reliability — 75 轮 / Claude Sonnet 4 / GitHub Copilot MCP server 43 工具:CLI 1,365 tokens / MCP 44,026 tokens;月 10K 操作 CLI $3.20 / MCP $55.20;MCP 7 次失败全是 ConnectTimeout(infrastructure-level,模型无法 reason 或 retry) → 与 mcp-protocol 的连接:新章节"2026-Q1 社区批评" 段含 ScaleKit 一手数据表
-
Tool Search 设计哲学:"工具按意图分组,不按 API 分" — 85%+ token 减少不只是工程优化,是工具集设计哲学的升级。Cloudflare 2 工具(search + execute)覆盖 2,500 API 端点是该原则的极端实证——把 CLI 哲学搬进 MCP 协议 → 与 agent-tool-design 的连接:相关概念加该原则
-
MCP 没死,但范围明确收缩到"云端生产 agent 标准化接入层" — Anthropic 4-23 博客是对 4-04 OpenClaw 事件 + Perplexity 出走 + Peter Steinberger 痛批的官方叙事修正。三条最终分工:本地开发 = CLI+Skills / 云端生产 = MCP+Skills / 简单一对一 = 直连 API。"好的 MCP 服务器应该像 CLI 一样设计" → 与 mcp-protocol / platform-layer-collapse 的连接:mcp 页加"最终分工"表 + platform-layer-collapse 加反向叙事修正条目
-
MCP + Skills 配套已成行业实践 — Claude 数据插件(10 Skills + 8 MCP servers 覆盖 Snowflake/Databricks/BigQuery/Hex)+ 第三方(Canva/Notion/Sentry)发布 MCP server 同时附带 Skills + 社区扩展让 Skills 从 MCP server 分发。Anthropic 把"MCP 管能力 / Skills 管编排"明确写进官方实践博客——回应 Peter "CLI + Skills 才是正道"批评,两者共存不矛盾 → 与 mcp-protocol 的连接:新章节"MCP + Skills 配套实证"
-
MCP 演进事件链已成形(2024-11 → 2026-04-23) — Anthropic 4-23 博客是这条事件链的关键节点(社区危机 → 官方反击)。完整时间线含 OpenClaw 政策(4-04)+ Perplexity 出走(3-11)+ Peter 痛批(4 月中)+ Anthropic 反击(4-23) → 与 mcp-protocol 的连接:新增完整事件链时间线表
事实核查记录¶
- ✅ Anthropic 博客标题 / 内容 / SDK 数据 → 直接 WebSearch 命中 claude.com/blog 一手来源
- ✅ ScaleKit benchmark 75 轮 / GitHub MCP 43 工具 / 1,365 vs 44,026 tokens / $3.20 vs $55.20 → 直接命中 ScaleKit 公司博客 + 开源 GitHub repo
- ✅ ScaleKit reliability 72%(18/25)/ 7 次 ConnectTimeout → ScaleKit 一手数据
- ✅ Perplexity CTO Denis Yarats 2026-03-11 Ask 2026 conference 表态 → 多源核实
- ⚠️ AGIHunt "Perplexity 72% 上下文被 MCP 占" 数字混淆 → 实际 Perplexity 是 reliability 72% 信号;72% 上下文消耗是 Apideck 案例(GitHub + Slack + Sentry,143K/200K)。wiki 按一手来源分开标注
- ⚠️ AGIHunt "旧金山街头随机调查 CLI 17 票 MCP 3 票" → 未独立核实,可能是娱乐性轶事,wiki 不引用
- ⚠️ AGIHunt "钉钉飞书绕开 MCP 直接做 CLI" → 未独立核实,中文社区话题,wiki 不引用
- ✅ Cloudflare MCP server 2,500 端点 + 2 工具(search + execute)→ Anthropic 官方博客直接确认
- ✅ Tool Search 85% / Programmatic Calling 37% → Anthropic 官方博客原文确认
- ✅ Canva / Notion / Sentry 发布 MCP server 同时附带 Skills → Anthropic 官方博客确认
- ✅ "龙虾之父 Peter" = Peter Steinberger(OpenClaw 创始人)→ 已 ingest platform-layer-collapse OpenClaw 段同一人物
待办¶
- Anthropic 在 2026-Q3 是否会公布 Tool Search 在生产环境的真实 token 节省数据?官方博客只给"in testing"数字
- ScaleKit 是否会出 benchmark v2 测试 Tool Search 启用后的 MCP 表现?这是验证"32x 缩到 7x"判断的关键
- Apideck 72% context 占用案例的完整原文是否有更详细数据?目前只通过二手转引
- "好的 MCP 服务器应该像 CLI 一样设计"原则的下一个标志性实证 —— 除 Cloudflare 2 工具方案外,是否会有 GitHub / Slack / Atlassian 等头部 MCP server 重构为同样思路?
- Sentino 主 Agent 的
read_xx工具集是否要按 "Cloudflare 2 工具模式" 重构?当 Standalone Agent 实例数 >100 时,N 个 read_xx 工具描述塞满上下文的问题会出现 —— 应在 Standalone Agent 规模化阶段重新评估 - AGIHunt 此前两次小问题(OpenClaw 措辞 + 72% 数字混淆)—— 下次摄取 AGIHunt 内容时默认走"原文核查 + 数字逐项 verify"流程,不能直接相信中文转载