2026-04-28 变更日志¶
摄取 Karri Saarinen《Some Notes on AI》¶
来源:raw/notes/karri-saarinen-some-notes-on-ai-2026-04-26.md(Linear co-founder/CEO Karri Saarinen 2026-04-26 X Article 长文,6 节产品哲学札记,139,837 views / 860 likes / 1687 bookmarks。X 直接抓取被 402 封锁,通过 fxtwitter API 拿到 article 字段全文)
新建页面¶
concepts/expertise-paradox— 专家悖论:AI 在你不懂的领域看起来神,在你懂的领域露馅。Saarinen 把 Gell-Mann Amnesia(Crichton 2002)+ Dunning-Kruger(Kruger & Dunning 1999)首次明确合流到 AI 评估场景。包含三层含义(市场叙事撕裂的根因 / 专家在 AI 时代更难但更有价值 / 销售决策的盲区)+ 三个领域具体表现(编程 / 设计 / 写作)+ 与 research-preview-pattern Anthropic "100% 才是真自动化"的关系(95%→100% 最后 5% = expert vs novice 评估差的具体长度)+ 5 条可操作去偏方法
关键知识提取¶
-
AI 市场叙事撕裂的最大单一根因 = expertise paradox — 不是模型在某些领域真的强 / 某些领域真的弱,是观察者判断力的不对称。Casual observer 用 Dunning-Kruger 模式评估(不懂目标领域)→ 看到 magic / 持有"无限能力"印象;Deep practitioner 用 Gell-Mann 模式评估("湿街道导致下雨"识别力)→ 看到 slop / 持有"具体边界"印象。两类持有的 AI 能力图景相差几倍——这不是态度差异,是评估机制差异 → 与 expertise-paradox 的连接:本概念页就是为承接这条命名移植而抽出的——Saarinen 是公开发言里第一个把这两个已有认知偏差概念合流到 AI 评估场景的命名者;同时回连 individual-vs-institutional-ai METR 实验"用 AI 实际慢 19%、自认快 20%、感知差 39 个百分点"——39 个百分点恰好是这两个机制叠加的具体测量
-
"Thinking tools" 不是 "Mechanical tools" 给 Harness 加新分类轴 — 传统工具是 mechanical(你用工具栏决定怎么 P 图,工具栏不会反向"建议"你接下来想画什么);AI 工具是 thinking(你 prompt AI 决定输出什么,但 AI 输出反过来 steer 你接下来怎么想)。双向 steer 关系让"工具影响工作流"命题强度比传统工具大一个数量级。Tool default 不是 default 而是 steering——Claude Code 给 todo 默认结构化清单 = steer 用户朝结构化思考方向 → 与 harness-engineering 的连接:在该页"工具影响工作流"命题之上加一节"thinking tools 不是 mechanical tools"作为新分类轴,给 Harness 设计哲学加"工具应该 steer 用户朝哪个方向"的产品哲学维度
-
"Hard problems remain hard" 给 95% / 100% 自动化论加任务分类层 — Linear 自家数据:cloud coding agent 月修 1000+ issues 持续加速。但 Saarinen 立刻补反例:"hard problems remain hard. Agentic coding does not speed those up as much as the narrative often suggests. The expert still supplies the taste, constraints, and final judgment."。这给 ai-first-engineering CREAO 95% + Anthropic Kat Wu 100% 加了任务分类层修正——smaller bandwidth 任务(重复 fix)可达 100%;hard problems(架构 / 系统 / tradeoff)永远需要 expert judgment。三家不冲突,覆盖三个维度(组织起步门槛 / 单流程合格线 / 任务难度天花板) → 与 ai-first-engineering 的连接:在 95% 操作定义 + Anthropic 100% 反向补强段后加"Linear Saarinen 视角的反例式补强"整段,明确两类任务分开评估,避免把 hard problems 也按 95% 路径推导致"5% 兜底实际是 50% 工作量"陷阱
-
"Design is planning" 反 design-to-code 工具假设 — Saarinen 作为前 Airbnb 首席设计师 + 前 Coinbase 创始设计师 + Linear CEO 给设计本质重定义:"Most design work is about making decisions, understanding the problem, and finding the fit. ... In the AI world, design is like planning for me." 设计 = 视觉 canvas 帮你的脑子问问题,不 = 写最终代码。Figma / Linear 这种"visual canvas + 不直接出 production code"的工具反而更贴合设计本质;design+code 工具把设计降级为 prototype as production,丢掉了设计真正的价值 → 与 agent-ui-is-product 的连接:在该页"反向极化:CREAO AI 不需要 UI"段后加"Design is planning" 整段;同时给 aesthetics-beyond-visual 加"专家级设计师看 AI 出图看到 slop(无法控制单点修改 / 滤镜污染)" 反向 magic 视角
-
AI 公司是 backend 类、UNIX 风格 composability — Saarinen 给"AI 公司应该长什么样"做了一个反 frontend 投入的判断:"I think many AI companies operate more like backend companies. The capability is the model. The harness and tools are being iterated above it, but so far they are often behind the scenes." 加 UNIX 类比:"programs are text based can be created independently and combined at runtime. The composability of the operating system is easier than compared to something like modern macOS." 给 sentino-agent 的具体含义:Standalone Agent 平台属于 backend 类,产品价值在 agent runtime / 工具协议 / Memex 记忆,不在 UI——把设计资源倾注在 IP 玩偶 + 粉丝场景(frontend 类),把 backend 资源倾注在 Standalone Agent 协议 / 接口 → 与 individual-vs-institutional-ai 的连接:在该页"双层共存"判断之后加"AI 公司是 backend 类、UNIX composability"整段,给"组织 AI 应该长什么样"加产品形态分类层;与 agent-ui-is-product 的张力通过"产品形态分类化解"——backend 类 vs frontend 类是不同战场,UI 必要性不同
-
"Vibe coding done well" 不带贬义的合法定义 — wiki 此前从腾讯研究院 + CREAO 自我证伪两侧观察 vibe coding,偏失败侧。Saarinen 给一个不带贬义的合法定义:vibe coding = "following the grain of the tool, moving quickly, accepting that the model has a direction and using that momentum"。这是合法的快速探索模式,但不能替代 planning——否则被 AI steer 朝最容易的方向。本页 6% 完成率是"试图把 vibe coding 当 production"的失败率,不是 vibe coding 整体无用 → 与 vibe-coding-creator-motives 的连接:在该页结语段前加"Vibe coding done well——Saarinen 视角的非贬义重新定义"整段;同时回连 pivot-speed-as-moat——Saarinen 给中间态战略加"不要无 plan,要短 plan"边界条件,反对 plan cycle 固化但同样反对"完全没 plan 让 AI 替你选简单的事"
更新页面¶
concepts/harness-engineering— 新增"'Thinking tools' 不是 'Mechanical tools' AI 工具的新分类轴"整段;相关概念加 expertise-paradox + individual-vs-institutional-ai;sources 加新 raw;updated → 2026-04-28concepts/ai-first-engineering— Anthropic 反向补强段后新增"Linear Saarinen 视角的反例式补强:'hard problems remain hard'"整段(含三家自动化覆盖率主张对照表 + 任务分类启示);相关概念加 expertise-paradox;sources 加新 raw;updated → 2026-04-28concepts/pivot-speed-as-moat— 新增"Saarinen 视角的修正:不要'无 plan',要'短 plan'"整段(含 Linear 6 个月 plan + 月/周可改实践 + Saarinen 反 plan 走过头警告 + 中间态战略边界条件对照表);相关概念加 expertise-paradox + harness-engineering;sources 加新 raw;updated → 2026-04-28concepts/agent-ui-is-product— 新增"'Design is planning'——Saarinen 视角的设计本质重定义"整段(含 Saarinen 设计师 expert 视角 + UI 必要性两层应用对照 + 与 generative-ui 的方向辨析);相关概念加 expertise-paradox + aesthetics-beyond-visual;sources 加新 raw;updated → 2026-04-28concepts/aesthetics-beyond-visual— 相关概念加 expertise-paradox 一行(专家级设计师看 AI 出图看到 slop / novice 看到 magic = 区分能力的 Gell-Mann 视角具体表现);sources 加新 raw;updated → 2026-04-28concepts/experience-over-knowledge— 相关概念加 expertise-paradox 一行(专家在 AI 时代更难但更有价值的机制层补强);sources 加新 raw;updated → 2026-04-28concepts/individual-vs-institutional-ai— 第三重困境后新增"生产力幻觉是 Dunning-Kruger 在 AI 使用场景的量化"整段;末尾新增"AI 公司是 backend 类、UNIX 风格 composability——Saarinen 视角的产品类型分类"整段;相关概念加 expertise-paradox + agent-ui-is-product;sources 加新 raw;updated → 2026-04-28concepts/bottleneck-shift-output-to-review— 适用边界段新增"审核者必须是 expert 否则审核失效"条目;末尾新增"'Hard problems remain hard'——任务难度天花板对瓶颈位移的修正"整段;相关概念加 expertise-paradox;sources 加新 raw;updated → 2026-04-28concepts/ai-vendor-spec-traps— "为什么这条值得独立成页"前新增"方法论根基:Gell-Mann Amnesia 在硬件领域的工程化"整段(6 条 checklist 是给 casual observer 借用 expert 视角的工具);相关概念加 expertise-paradox;sources 加新 raw;updated → 2026-04-28concepts/agent-tool-design— "反例:vibe coding 平台" 前新增"'用户能并行运行多少 agent' 是工具设计的隐藏约束"整段(Harrison Bergeron 类比 + 静默兜底式 vs 主动推送式选择 + Sentino Standalone Agent 启示);相关概念加 expertise-paradox;sources 加新 raw;updated → 2026-04-28concepts/ai-adoption-landscape-2026— "五组数据的统一图景" 前新增"doom vs hype 二分撕裂的认知机制"整段(新兴市场 80%+ 使用率 + 高兴奋度 = novice 主导 = Dunning-Kruger / 美国 60% 使用率 + 33% 觉得 AI 让工作变好 = expert 主导 = Gell-Mann);相关概念加 expertise-paradox;sources 加新 raw;updated → 2026-04-28concepts/vibe-coding-creator-motives— 结语段前新增"'Vibe coding done well'——Saarinen 视角的非贬义重新定义"整段(合法定义 + 三类合法场景 + 6% 完成率的修正解释 + Sentino 应用边界);相关概念加 expertise-paradox;sources 加新 raw;updated → 2026-04-28concepts/research-preview-pattern— 相关概念加 expertise-paradox 一行("100% 才是真自动化"的心理学解释——novice 容易满足于 95%、expert 才坚持到 100%);sources 加新 raw;updated → 2026-04-28wiki/index.md— Agent 框架与架构子分区末尾加 expertise-paradox 一行;最近更新加一条 2026-04-28(单行硬约束)
事实核查记录¶
- WebSearch "Karri Saarinen Linear CEO co-founder Airbnb Coinbase" → 完全核实身份:Linear co-founder/CEO(Linear 2019 成立、估值 $1.25B、客户 OpenAI/Ramp/Vercel、Sequoia + Accel 投资)/ 前 Airbnb 首席设计师 + 设计系统共建者 / 前 Coinbase 创始设计师(约第 12 号员工到 100 人)/ Kippt 共同创始人(被 Coinbase 收购)/ Rails Girls 共同创始人 / YC alumni S12。多源吻合(First Round Review podcast / The Twenty Minute VC / The Org / LinkedIn / X 简介)
- WebSearch "Linear app coding agent integration 2026 Symphony" → 核实 Linear 2026-03-24 自家发布"Linear Agent"(The Register 报道,Saarinen 公开 quote "issue tracking is dead")/ 75% Linear enterprise workspaces 已装 coding agents / agent 工作量过去 3 个月 5x。Saarinen X 文章里 "5x in few months" 即此官方数字,已独立核实。Symphony 上下文:OpenAI 2026-03 开源 / Elixir + BEAM / 轮询 Linear / 4 天 8.7K stars 后超 15.2K stars / "low-key engineering preview"——与 Saarinen 之前 https://x.com/karrisaarinen/status/2031773828284919878 提到的 "OpenAI Symphony repo drops → surge in new Linear workspaces" 吻合
- WebSearch "Gell-Mann amnesia Michael Crichton definition origin" → 核实 Crichton 2002-04-26(巧合:与 Saarinen 文章正好相隔 24 年同一天)"Why Speculate?" 演讲提出 / 借物理学家 Murray Gell-Mann 名打趣 / 定义:在你专业领域看到文章错漏,翻页后却继续相信其他领域。Saarinen 在 AI 评估场景的应用是首次见到的明确命名移植,是这次摄取的核心独立判断
- WebSearch "Harrison Bergeron Vonnegut handicapper interruptions" → 核实 Vonnegut 1961 短篇 / 反乌托邦平等 / 智者每 20 秒戴耳机被噪音打断思考 / 主角 George 反复被打断无法连续推理。Saarinen 用 "constantly pings you and disrupts your thinking process" 类比工程师 agent 数过多的认知干扰,类比精确
- 客户文档陷阱检查:本素材是 Linear CEO 个人长文(产品哲学博文),不是客户向 PRD/RFP/提案/合同,不触发该专项检查。文中提及 Anthropic / Claude / UNIX / MCP / CLI / API 都是行业横向引用,不是客户已选型问题
- 抓取手段:X.com 直接抓 WebFetch 返回 402(X 已封锁未登录抓取)/ Nitter 镜像被 SSL 证书错误 / vxtwitter 只返回重定向 / fxtwitter API 抓到 article 字段全文——X Article(长文)形态的正文存在 article.content.blocks 数组里,text 字段为空。这是这次摄取的工具发现,下次摄取 X Article 直接用
https://api.fxtwitter.com/{user}/status/{id}JSON 端点 - "TechnoCore" / Hyperion 引用:核实是 Dan Simmons 1989 Hugo 奖作品中的 AI 文明设定,Saarinen 借此讽刺"AI 自立门户"远期叙事——与他 cautiously optimistic 立场一致
与同期 wiki 的时点关系¶
- 2026-04-23~04-28 这一周里第三个独立头部组织样本讨论 AI 实施现实——Anthropic Kat Wu(4-25 / Lenny Rachitsky 播客)/ Walmart(4-27 摄取)/ Linear Saarinen(4-26 X 长文)。三家口径高度一致:hard problems remain hard / 95% 不是真自动化 / agent 不是 vibe coder——这条三方独立同源的证据已经强到值得认为是 2026-04 头部 AI 落地共识,而不是某家个别判断
- Saarinen 给 ai-first-engineering CREAO 95% 论一个反例式补强:他不反对 95%,但加了 expert vs novice 不对称——模型在 expert 领域是 50→90 的辅助加速器,在 novice 领域是看起来 90 实际可能 30
元观察¶
- expertise paradox 是 wiki 缺的一块基础概念 — 这次抽出后回头看,wiki 里 individual-vs-institutional-ai METR 39 个百分点 / aesthetics-beyond-visual 区分能力 / experience-over-knowledge 经验升值 / research-preview-pattern 100% 才是真自动化 / ai-vendor-spec-traps 6 条 checklist 都在使用同一认知机制但没命名。expertise paradox 抽出后给这 5 页提供了共同的机制层根基
- X Article 抓取工具发现 — fxtwitter API JSON 端点是 X Article(长文)正文唯一可靠的免登录抓取方式。X 直抓 402 / Nitter SSL 失败 / vxtwitter 只重定向。这个发现应该写入 ingest 工作流文档(CLAUDE.md 或 scripts/ 目录),下次摄取 X Article 不用重新踩坑
- Saarinen 这篇文章是 wiki 里第一篇把 6 节产品哲学札记拆散到 7+ 个已有概念页的素材 — 既不立"作者卡片"页(与既有 wiki 不立人物页规则一致,只有 Hinton 这种历史奠基级才有独立页)也不立"文章合订本"页,而是拆到具体概念页 + 抽 1 个独立新概念。这是处理"密度高 + 多论点 + 单一作者长文"的可复用模板,下次类似素材(PG essay / Sam Altman blog / Naval tweet 集)可参考
待办¶
- 追踪 expertise paradox 命名是否会扩散到业界 — Saarinen 2026-04-26 是首次明确命名,半年后看是否被其他 PM/产品哲学人引用、形成业界统一术语(可能候选反例:Gell-Mann + Dunning-Kruger 拼词太长,可能不会广泛传播——但概念本身可能以其他名字流传)
- 追踪 Linear "Linear for Agents" beta(2025-04 公开) / Linear Agent 2026-03 GA 后续数据 — Saarinen 主张"Linear 是 agent + 人共享 context 的最佳层",下次 Linear ARR 公开数据时回 sentino-agent 评估"是否要做类似的 agent + 人协作工具层"
- Sentino Standalone Agent 实例数 / 用户日均触发的 agent 并行数 — Saarinen 的 Harrison Bergeron 阈值在 Sentino 用户场景的具体值是多少?这条数据当前没采集,但是产品决策的关键输入(→ agent-tool-design 静默兜底式 vs 主动推送式)。建议在下次 Sentino 产品复盘前先把这条 metric 加入埋点
- "AI 公司是 backend 类" 判断对 Sentino 资源分配的具体含义 — Sentino 当前在 Standalone Agent App UI 上的设计资源投入是多少?是否符合 Saarinen "backend 类资源倾注在协议 / 接口"主张?这是 Sentino 内部资源分配检视的具体角度,建议下次 Lawrence/子昕 产品讨论时纳入
摄取 Google Memory Bank 调研¶
来源:raw/notes/google-memory-bank-research-2026-04-28.md(用户网络调研后产物,非原始网页素材聚合,调研日期 2026-04-28;Vertex AI 托管记忆服务,2025-07-08 公开预览 / 2025-12 GA / 2026-04-22 Cloud Next 改名 Agent Platform Memory Bank;算法根基 ACL 2025 论文 RMM)
新建页面¶
concepts/google-memory-bank— Google Vertex AI 托管 Agent 长期记忆服务。算法根基 RMM 论文(Prospective + Retrospective 双反射机制 in utterance/turn/session 三粒度)。架构二层(Sessions 短期 + Memory Bank 长期)+ 4 managed topics(USER_PERSONAL_INFO / USER_PREFERENCES / KEY_CONVERSATION_DETAILS / EXPLICIT_INSTRUCTIONS)+ Custom topics + 两种写入姿态(GenerateMemories 后台异步 + CreateMemory memory-as-a-tool)+ Scope arbitrary dict + IAM Conditions + memory revisions 可审计 + TTL + 强制绑 Gemini。完整 4 方对比矩阵(Memory Bank vs Auto Memory vs Memex vs mem0)+ Memory Bank 把 mem0 自承 4 大未解问题给了 2 个直接答案 + Memex 仍保留差异化清单 + Memex v2 借鉴选项
关键知识提取¶
-
Google Memory Bank ≈ Memex 的托管版 — 同后台流水线 + 异步提取 + 抗膨胀路线,差异在 topic 预定义 + 强制绑 Gemini + scope/IAM 治理内置。Memex 销售姿态从"对照 mem0 一家"扩到"对照 mem0 + Memory Bank 两家",Memory Bank 是更难回答的对照样本——客户问"为什么不用 mem0"可以拿"路线代际"答(向量 vs 文本结构化),问"为什么不用 Memory Bank"必须用"具体能力对比 + 业务约束"回答(数据主权 / 模型解绑 / 算法定制深度) → 与 sentino-memex 的连接:在该页"对外定位锚点"段后新增"2026-04 销售对照样本扩展:从 mem0 单对照到三对照"整段(含 mem0 vs Memory Bank 论证差异对照表);同时在"待观察 / 改进点"段新增第 5 条"Memory Bank 启发的 v2 设计选项"(4 个对照可借鉴点)
-
mem0 自承的 4 大未解被 Google 部分内置回答 — staleness 问题被 Memory Bank TTL + GENERATE_UPDATED_TTL 直接答;governance 问题被 Memory Bank IAM Conditions + 专用角色(memoryViewer/Editor/User)+ scope 隔离直接答;consent 部分(EXPLICIT_INSTRUCTIONS topic + memory revisions);cross-session identity 部分(scope arbitrary dict 间接支持)。对 mem0 作为"行业代名词"的稳定性影响:短期内(半年到一年)mem0 的代名词地位还在(开源生态领先),长期(2027+)若 Memory Bank 在企业客户案例上跑通,mem0 可能从"代名词"退化为"开源 PoC 选项" → 与 mem0 的连接:在"mem0 自承的 4 大未解问题"段后新增"2026-04 更新:Google Memory Bank 把这 4 个问题给了部分内置答案"整段(含完成度对照表 + 行业代名词稳定性影响判断);相关概念加 google-memory-bank
-
同一服务两种写入姿态并列是 Memex 当前没有的 — Memory Bank 把"被动后台提取"(GenerateMemories,与 Memex flush 模式一致)和"主动工具调用"(CreateMemory,与 Auto Memory / mem0 一致)在同一服务下并列。Memex 当前只支持被动提取一种姿态。这是 Memex v2 演进时可考虑的设计点——不是因为 Memory Bank 这么做就要跟,而是两种写入姿态分别覆盖不同 agent 行为模式(被动学习用户 vs 显式记某事),合并成一个服务的工程负担可控 → 与 auto-memory 的连接:相关概念加 google-memory-bank 一行(反方向托管对照:单姿态 LLM-in-the-loop vs 两种姿态并列,Memory Bank 的 CreateMemory 接近 Auto Memory 路线);与 sentino-memex 待观察段新增"两种写入姿态并列"作为 v2 设计选项
-
Scope arbitrary dict + IAM Conditions 是 Memex 多客户白标场景的潜在演进方向 — Memory Bank 的 scope 是开发者自定义键值对(如
{user_id: '123', session_id: '456'}做 session 级隔离),可按 scope keys 分别配置不同 customization。Memex 当前是userId × projectId二维固定隔离。多客户白标场景下(比如 yukai-agora-poc 这种 OEM 项目),Memex 可能需要演进到 arbitrary dict scope。同时 Memory Bank 内置的 memory revisions + IAM Conditions(专用角色 memoryViewer/Editor/User)是 Memex 在合规客户场景需要补的可审计层 → 与 sentino-memex 的连接:待观察段新增"Scope 演进为 arbitrary dict" + "Memory revisions API + IAM" 两条 v2 设计选项 -
Memory Bank 的 "Gemini 自动 contradiction resolution + consolidation" 是 Auto Dream 整合机制的托管版 — Memory Bank 把记忆合并放在写入路径上(Gemini 在后台自动判断和处理冲突),与 Auto Dream 定时离线整合(≥24h + ≥5 sessions 触发四阶段)路线不同但目标相同。Memex 走的是"夜间 3 AM 定时合并 + Reinforce 续期"中间路线(既不像 Memory Bank 写入时合并,也不像 Auto Dream 完全离线整合) → 与 auto-dream 的连接:相关概念加 google-memory-bank 一行(差异:Auto Dream 是定时离线整合,Memory Bank 靠 Gemini 在写入路径上自动合并)
-
Memory Bank 改名要追溯:2026-04-22 Cloud Next 后官方是 Agent Platform Memory Bank — 用户素材里说的"Agent Memory Bank"不准确,实际官方命名是 Agent Platform Memory Bank(与 Agent Platform Sessions / Agent Runtime 形成命名一致性)。Vertex AI 整体改名 Gemini Enterprise Agent Platform,per-agent pricing + 200-model Model Garden + Workspace Studio 无代码构建。对 Sentino 销售的预警:客户提"Memory Bank"时要确认是 2026-04-22 后的命名(Agent Platform Memory Bank)还是 2025-2026Q1 的旧称(Memory Bank),客户是否在 GCP 全栈深度决定其是术语对照需求还是真技术选型对抗 → 与 yukai-agora-poc 的连接:在 AC-08 决策段后新增"2026-04-28 销售对照样本扩展"段(含 mem0 vs Memory Bank 客户姿态判断差异 + 五维论证清单引用);相关概念加 google-memory-bank
更新页面¶
concepts/sentino-memex— "对外定位锚点"段后新增"2026-04 销售对照样本扩展:从 mem0 单对照到三对照"整段(含两个对照样本论证差异对照表 + Memory Bank 是更难回答的对照样本论证);"待观察 / 改进点"段新增第 5 条"Memory Bank 启发的 v2 设计选项"(4 个对照可借鉴点:两种写入姿态 / arbitrary dict scope / Memory revisions API + IAM / topic 概念化对照);相关概念加 google-memory-bank;sources 加新 raw;updated → 2026-04-28concepts/mem0— "mem0 自承的 4 大未解问题"段后新增"2026-04 更新:Google Memory Bank 把这 4 个问题给了部分内置答案"整段(含完成度对照表 + mem0 行业代名词稳定性影响判断 + Sentino 销售姿态调整);相关概念加 google-memory-bank;sources 加新 raw;updated → 2026-04-28concepts/auto-memory— 相关概念加 google-memory-bank 一行(反方向托管对照:单姿态 LLM-in-the-loop vs 两种姿态并列,Memory Bank 的 CreateMemory 接近 Auto Memory 路线);updated 不动(仅交叉引用变化,未新增段落)concepts/auto-dream— 相关概念加 google-memory-bank 一行(Memory Bank 的 Gemini 自动 contradiction resolution + consolidation 是 Auto Dream 整合机制的托管版,差异在写入路径合并 vs 定时离线整合);updated 不动projects/yukai-agora-poc— "为什么这不是客户已选 mem0"段后新增"2026-04-28 销售对照样本扩展"整段(含 mem0 代名词 vs Memory Bank 真选型的客户姿态判断差异 + 五维论证清单引用);相关概念加 google-memory-bank;sources 加新 raw;updated → 2026-04-28projects/sentino-agent— "对外定位锚点"段后新增"2026-04 销售对照样本扩展:从 mem0 单对照到 mem0 + Memory Bank 双对照"整段(含两个对照样本论证差异 + 销售材料补 Memory Bank 列建议);相关概念加 google-memory-bank;sources 加新 raw;updated → 2026-04-28wiki/index.md— 「记忆系统」章节新增 google-memory-bank 一行(描述其作为托管路线代表 + 把 mem0 未解答案给了内置 + 与 Memex 同方向但绑 Gemini);最近更新加一条 2026-04-28(单行硬约束)
事实核查记录¶
- WebSearch "Vertex AI Memory Bank public preview Google Cloud July 2025 announcement" → 完全核实 2025-07-08 公开预览 / Vertex AI Agent Engine 下 / Gemini 后台异步提取 / ADK + LangGraph + CrewAI 框架支持 / Express Mode 用 Gmail 注册 / 额外发现 Memory Bank 已 GA(用户素材未提,行业报道在 2025-12 前后转 GA),写入新页面时标注
- WebSearch "Reflective Memory Management arxiv 2503.08026 ACL 2025" → 完全核实论文存在 / 16 位作者全名(Zhen Tan, Jun Yan, I-Hung Hsu, Rujun Han, Zifeng Wang, Long T. Le, Yiwen Song, Yanfei Chen, Hamid Palangi, George Lee, Anand Rajan Iyer, Tianlong Chen, Huan Liu, Chen-Yu Lee, Tomas Pfister)/ ACL 2025 Long Papers pp 8416-8439 Vienna / DOI 10.18653/v1/2025.acl-long.413 / Prospective + Retrospective 双反射机制 / 解决 rigid granularity + fixed retrieval 两个文献痛点
- WebSearch "Gemini Enterprise Agent Platform Vertex AI rename Cloud Next 2026" → 完全核实 2026-04-22 公布 / Vertex AI 改名 Gemini Enterprise Agent Platform / 4 pillars (~~create~~ → Build/Scale/Govern/Optimize) / 200-model Model Garden / per-agent pricing / Workspace Studio 无代码 / A2A 协议 v1.0 / Microsoft + AWS + Salesforce + SAP + ServiceNow 承诺原生支持。重要修正:Memory Bank 改名后官方是 "Agent Platform Memory Bank",不是用户素材里说的 "Agent Memory Bank"。Agent Engine → Agent Runtime / Agent Builder Sessions → Agent Platform Sessions
- 2026-04-28 后续修正(本日同日):上一条括号里写的 "create" 是错的——Google 官方是 Build/Scale/Govern/Optimize。修正在本日"摄取 Google Agent Platform 完整架构"节有更详细背景。本注脚保留原条以承认错误轨迹
- WebSearch "Vertex AI Memory Bank scope IAM permission topic types" → 完全核实 4 个 managed topics 名称和定义(USER_PERSONAL_INFO / USER_PREFERENCES / KEY_CONVERSATION_DETAILS / EXPLICIT_INSTRUCTIONS)/ scope 是 arbitrary dict(如
{user_id: '123', session_id: '456'})/ IAM Conditions + memoryScope 表达式(CEL 写)/ specialized roles(memoryViewer / memoryEditor / memoryUser)/ TTL GENERATE_UPDATED_TTL 配置(每次 update 重置过期时间)/ memory revisions 可结合 IAM 控访问 / customization 可按 scope keys 分别配置 - 客户文档陷阱检查:本素材是用户网络调研后产物(不是客户向 PRD/RFP/提案/合同),不触发该专项检查。素材中提及客户场景(YUKAI PRD AC-08、Hotmind 等)都是 Sentino 内部销售姿态判断的对照引用,不是客户已选型 Memory Bank
与同期 wiki 的时点关系¶
- 2026-04-28 同日两次摄取(早些 Karri Saarinen / 后摄 Memory Bank 调研)都涉及"AI 工具产品形态判断"——Saarinen 给"AI 公司是 backend 类、UNIX 风格 composability"判断,Memory Bank 是 Google 在记忆领域的 backend 形态实证(API 服务 + 框架支持,不直接面向终端用户)。两者形成时点呼应——backend 类 AI 公司大量出现是 2026-04 的市场结构特征
- Memory Bank GA + 改名是 2026-04 头部模型公司"agent platform 化"趋势的具体证据:Anthropic Claude Cowork(research-preview-pattern)/ Walmart agentic AI 战略(agent-creator-refiner-operator Refiner+Operator 实证)/ Google Gemini Enterprise Agent Platform,三家头部不约而同把"agent 平台"作为产品形态独立成一级——Sentino Agent 平台的方向判断在头部公司战略上有同源验证
- 2026-04 是 Memex 销售姿态的转折点:4-17 摄取 mem0 是首个对照,4-28 摄取 Memory Bank 是第二个对照,未来一年内可能出现第三个对照(OpenAI / Anthropic / Microsoft 任一推出托管记忆服务)。Memex 销售物料应当从单对照扩到三对照,论证维度从"路线代际"扩到"路线 + 控制权 + 模型策略 + 数据主权 + 定制深度"五维
元观察¶
- 第三方记忆方案对照样本现在有 4 个完整覆盖(Auto Memory / Memex / mem0 / Memory Bank),形成完整的 2x2 矩阵:
- 托管 vs 自建:Memory Bank(托管)vs Memex(自建)
- 后台流水线 vs LLM-in-the-loop:Memory Bank/Memex(后台)vs Auto Memory(LLM 主动)
- 文本结构化 vs 向量检索:前三家(文本)vs mem0(向量)
这 4 个样本对应 3 个独立分轴的端点,是足够 MECE 的对照系统。后续新出现的方案可以按这 3 个轴定位,不需要无限扩对照样本——除非出现 3 个轴之外的新分轴(如"on-device 边缘记忆"or"区块链记忆")才需要新建对照 - Memex 的"自建 + 文本结构化 + 后台流水线"组合在 4 个样本中是唯一占据"自建 + 后台流水线"象限的方案 — Memory Bank 是"托管 + 后台流水线",Auto Memory 是"自建 + LLM 主动",mem0 是"开源/托管 + 后台/LLM 决策混合"。这意味着 Memex 的核心差异化论点应当强化"自建 + 后台流水线"组合的稀缺性——客户要"完全自主可控 + 异步处理"只能选 Memex 自建路线(或自己搓一个 Memory Bank 替代品,工程量大) - 客户文档里第三方技术名陷阱在 Memory Bank 场景的新形态 — 与 mem0 的"代名词"性质不同,Memory Bank 在客户 PRD 里出现大概率是真技术选型(GCP 全栈客户决定用一等公民方案)。Sentino 销售要主动判断"客户是术语对照需求还是真选型对抗"——判断依据是客户已有 GCP 基础设施深度。这条加进 yukai-agora-poc 的"销售姿态预警"待办
待办¶
- 销售材料
sentino-memex-positioning.md中英文版补 Memory Bank 列 — 当前材料只有 mem0 vs Memex 对比,需要扩为 mem0 vs Memory Bank vs Memex 三方对比,差异化论证从单维(路线)扩到多维(路线 + 控制权 + 模型策略 + 数据主权 + 定制深度) - Memex v2 设计选项是否纳入路线图 — 4 个对照可借鉴点(两种写入姿态并列 / Scope arbitrary dict / Memory revisions API + IAM / Topic 概念化对照)需要姜涛和子昕评估优先级。建议先做"Memory revisions API + IAM"——客户合规场景需求最迫切
- 跟踪 Memory Bank 在 GA 后的实际企业客户案例(Google 公布的 case studies 多大规模?)— 决定 Memory Bank 是否成为"企业级 Agent 记忆"事实标准,影响 Memex 的市场定位调整时机
- 跟踪 LongMemEval 之外的横向 benchmark(vs mem0 / MemGPT 实测对比)— 判断 RMM 论文宣称的 +10% 优势在工业场景是否成立,决定 Memex 是否有必要实现 RMM 的多粒度反射机制
- 跟踪 2026 内是否有"开源 RMM 实现"出现(论文公开,复现门槛中等)— 如果出现高质量开源实现,Memex 可考虑借鉴其多粒度反射设计,把 4 级 TTL × 4 类内容二维结构升级到 3 粒度 × 4 级 × 4 类三维
- ADK(Google Agent Development Kit)渗透率追踪 — 决定 Memory Bank 是否成为"Google 全栈客户的事实标准"。如果 ADK 在企业开发者中超过 LangGraph + LangChain 占比,Sentino 在 Google 全栈客户面前 Memex 销售难度会显著上升
Memex v2 设计选项评估报告(基于 Memory Bank 4 个借鉴点)¶
新建:2026-04-28-memex-v2-design-options(status: draft, version: 1)
缘起:摄取 Google Memory Bank 后用户追问"memex 借鉴点详细说明"。知识库已有内容只到"标题级摘要 4 行",没有工程级拆解 / 优先级排序 / 反建议——独立成报告把 4 个借鉴点提升到"姜涛 + 子昕可直接拿去排期的工程提案"。
核心结论: - P1 必做:① 两种写入姿态(CreateMemory)+ ④ source 字段(一起做 1 周)/ ③ Revision API + IAM 分级(2-3 周) - P2 等触发:② Scope arbitrary dict(触发条件是"第二个 agent 类型接入"或"多 agent 共享平台") - 反建议:4 个借鉴点没有一个是"看到 Memory Bank 这么做就要跟"——都是 Memex 自身业务驱动决定,Memory Bank 只是给了 API 形态参考。如果近 3 个月无合规客户线索 + Reinforce 命中率 < 50% + 单 agent 阶段,全部缓做合理 - 不变量(4 个借鉴点都不应触及):不绑 LLM 厂商 / 4 级 TTL × 4 类二维结构 / Reinforce 主动续期 / 夜间合并定时任务 / 数据主权
业务驱动力最强:借鉴点 ③(Revision API + IAM)— 合规客户场景硬卡点,没有的话直接销售失败
对其他页面的修正记录:
- sentino-memex "待观察 / 改进点"段第 5 条加优先级标注 + 报告回连
- google-memory-bank "对 Sentino Memex 演进的具体启示"段尾部加报告回连
- sentino-agent 相关概念段加报告条目
- wiki/index.md "## 研究报告" 章节加新条目(按时间倒序顶部)+ "最近更新"加一行
元观察¶
- 报告 vs concept 的边界判断验证:本次的 4 个借鉴点工程评估带作者立场(推荐 P1/P2/P3 + 反建议 + 不变量)+ 跨多个 concept(sentino-memex / google-memory-bank / mem0 / auto-memory)+ 一次性时间点产物——完全符合 ~/obs/CLAUDE.md report 类型定义。如果硬塞进 concept 页会破坏"中立事实"原则。
- 报告 vs 销售物料的边界:本报告聚焦工程实施评估(API / 字段 / 工程量),不替代
sentino-memex-positioning.md的客户向销售物料工作。两者是不同读者面向(团队内排期 vs 客户对外说明)。 - Memex v2 工作的两条平行路径:①借鉴点工程评估(本报告)+ ②销售物料 mem0 → mem0+Memory Bank 双对照升级(sentino-memex "对外定位锚点"段已铺垫)。两条路径独立推进,但共用"Memex 不变量清单"作为协同锚点。
摄取 Google Agent Platform 完整架构¶
来源:raw/notes/google-agent-platform-research-2026-04-28.md(用户网络调研后产物,2026-04-28;2026-04-22 Cloud Next Las Vegas 公布的 Vertex AI 改名整体平台;6+ 处官方/学术/行业 source 已交叉核实;摄取背景:知识库上一份调研 google-memory-bank(同日 ingest)只覆盖 Scale 柱单组件,把局部当整体处理——本次是父概念)
新建页面¶
concepts/google-agent-platform— Google Gemini Enterprise Agent Platform 父概念页。4 pillars × 18 组件完整骨架(Build 3 / Scale 7 / Govern 7 / Optimize 4 + 跨切 Model Garden 200+/Workspace Studio/A2A/Managed MCP)+ 配套 TPU 8t/8i + 战略含义 4 信号(4-pillar 词汇借鉴 / Govern 三件套预警 / ADK graph-based 三向分叉 / Model Garden 同方向不同动机)+ 与已有 11 页对位关系矩阵 + 适用边界(不是 Sentino 直接竞品)
关键知识提取¶
-
4 pillars × 18 组件全栈内化是 platform-layer-collapse 最强单一实证 — 之前的坍缩证据(Anthropic Claude Code → Cowork → Computer Use)是按时间线分段推进,Google Agent Platform 是一次性宣布全栈:从 Build(Agent Studio + ADK + Garden)到 Optimize(Simulation + Eval + Observability + Optimizer),每个 18 个组件之前都对应至少一家初创公司的核心产品。等于"模型公司一次性吃掉一整代 agent infra 创业公司"。配套 TPU 8t/8i + Anthropic 3.5 GW anchor + Cross-Cloud Infra = 硬件+模型+平台+治理+分发全栈垂直整合 → 与 platform-layer-collapse 的连接:在该页"其他厂商类似路径"段后新增"Google Agent Platform 实证:18 组件单平台内化"整段(含 vs Anthropic Claude Code 路径对比表 + 对中间层公司类型影响判断 + 与 agent-creator-refiner-operator 三元论"Creator 必吃 / Refiner+Operator 中间层"完全一致的判断)
-
Govern 三件套(Identity + Registry + Gateway)= 企业 agent 治理标准化方向 — Agent Identity 用 SPIFFE 标准 + X.509 证书 + mTLS + DPoP(端到端 cert-bound token / Service Account 不能 impersonate / 不允许长期 key);Agent Gateway = Thomas Kurian 称"air traffic control" + preventative enforcement before action + 多协议(MCP/A2A/REST/gRPC)但只有 MCP 支持基于 protocol attribute 的授权策略条件;Agent Registry = 中央 catalog + 自动从 deployment 注册。这与 Microsoft Agent 365 Entra ID 是行业标准化方向——Sentino 短期内追不上 Google AP 全栈,但企业客户问起来要有答案 → 与 sentino-agent 的连接:在"对外定位锚点"段前新增"Google Agent Platform 4-pillar 词汇借鉴 + Govern 三件套预警"整段(含 4-pillar 现状对照表 + Govern 三件套预警 4 条 + ADK graph-based 三向分叉表 + Memex revisions API + IAM 是 Govern 柱最小可行起步定位)
-
ADK 改 graph-based 子 agent 网络是反 orchestration-free-agents 方向行业证据 — google-adk PyPI 2026-04-21 发布 + ADK v1.0 stable 跨四种语言 + 核心升级是从线性子 agent 改为graph-based 子 agent 网络(显式 DAG 编排)。Google 押"显式编排是对的",回应 LangGraph,反映行业从"单 agent + tool-calling"到"orchestrated 多 agent"转向。三种路径并存:显式 graph 编排(Google ADK / LangGraph)/ 父→子 Subagent 层级(Claude Agent SDK)/ 无编排(Carlini)/ Amphiflow 默认 workflow(amphiflow-pattern) → 与 orchestration-free-agents 的连接:在该页加"反方向证据:行业头部正在押显式编排(2026-04 Google ADK 升级)"整段(含三种路径对照表 + Carlini 哲学的边界 + 对 Sentino 的具体含义"当前不必跟随 Google ADK graph 化");同时与 claude-agent-sdk 加"同类对标:Google ADK"段(含两个 SDK 7 维度对比表)
-
Agent Platform 是 Creator + Refiner 平台典型实例,不直接做 Operator — Google 把 Build 柱(Creator 工具)+ Scale 柱(Refiner 基础设施)一次性内化进自己的全栈平台,但主动不做 Operator——把执行类应用留给 ServiceNow / Salesforce / SAP 接 A2A 协议自己实现。这印证 agent-creator-refiner-operator 三元论"Creator 是模型公司必吃赛道,Refiner+Operator 是中间层生存空间"——证明这条边界不是中间层创业公司一厢情愿,是模型公司主动让出的空间(因为 Liability Wall + Integration Moat) → 与 agent-creator-refiner-operator 的连接:在该页"Devin / Manus 反例"段前新增"Google Agent Platform:Creator + Refiner 平台典型实例"整段(含三元论位置对应表 + 为什么 Google 不做 Operator 的 Liability Wall + Integration Moat 解释 + 对四类中间层公司影响表)
-
TPU 8t/8i 是 v8 训练-推理拆分的延续,没撤回反而更细化 — 2026-04-22 Cloud Next 同期宣布 TPU 8t(训练,Sunfish,Broadcom,121 FP4 EFLOPS/pod,Anthropic 3.5 GW anchor)+ TPU 8i(推理,Zebrafish,MediaTek,10.1 FP4 PFLOPS/chip,384 MB on-chip SRAM,80% better perf-per-dollar)。代工合作伙伴分叉(Broadcom 训练 / MediaTek 推理)反映 Google 在不同 workload 上对供应链合作伙伴的不同偏好。MediaTek 股价创纪录(TWD 2,090 daily limit)= 商业化预期。 → 与 google-tpu-v8 的连接:在该页加"TPU 8t / 8i:v8 训练-推理拆分的延续"整段(含 8t / 8i 双 SKU 详细参数表 + Anthropic anchor customer 含义 + 含义 4 条);与 training-inference-bifurcation 的连接:在该页加"TPU 8t/8i 进一步实证"整段——v7 还是单 SKU、v8 拆双 SKU、8t/8i 继续双 SKU + 供应链分叉三代连续产品决策站稳判断
-
Agent Gateway 多协议中 MCP 享有特殊地位 = MCP 平台基础设施渗透 Layer 4 — Agent Gateway 支持 MCP / A2A / REST / gRPC 多协议,但只有 MCP 支持基于 protocol attribute 的授权策略条件。这是 agora-convoai-join-api Agora 把 mcp_servers 内置进 LLM 配置(Layer 3)之后更高一层的渗透。对 Sentino 的具体含义:当客户切到 Google Agent Gateway 做治理时,MCP server 形态会比 REST 形态获得更细粒度的策略支持——给"Sentino 是否要把工具暴露成 MCP server 形态"开放问题加了新输入 → 与 mcp-protocol 的连接:在该页加"Google Agent Gateway 多协议中 MCP 享有特殊地位"整段(含四协议对照表 + Layer 1-4 渗透阶梯升级表 + 对 Sentino 的具体含义"server 端暴露 MCP 也开始有差异化收益")
修正上次摄取的事实错误¶
修正点:本日早些时候摄取 Google Memory Bank 时,事实核查段写 "4 pillars (create/scale/govern/optimize)"——"create" 是错的,官方是 Build/Scale/Govern/Optimize(WebFetch Google Cloud 官方公告原文核实)。
修正方式:本日 journal 早些段("摄取 Google Memory Bank 调研" 节内事实核查记录)保留原条但加注脚说明错误轨迹("~~create~~ → Build"),不删除——保留事实核查的真实演进过程。本节是更详细背景说明。
更新页面¶
concepts/google-memory-bank— 顶部加引用框说明"是 Agent Platform Scale 柱子组件之一"+ 父概念页链接 + Memory Profiles 子能力关系澄清;frontmatter sources 加 google-agent-platform raw;相关概念加 google-agent-platform(置顶为父概念)concepts/platform-layer-collapse— "其他厂商的类似路径"段 Google 行加 4-22 改名说明;"反向力量:开源模型追平闭源"段后新增"Google Agent Platform 实证:18 组件单平台内化(2026-04-22)"整段(含 4 pillars 内化组件表 + 4 条"为什么是最强单一证据" + vs Anthropic Claude Code 路径对比表 + 对中间层公司影响表 + 与三元论一致性判断);frontmatter sources 加 raw / updated 2026-04-28;相关概念末尾加 google-agent-platformprojects/sentino-agent— "对外定位锚点"段前新增"Google Agent Platform 4-pillar 词汇借鉴 + Govern 三件套预警(2026-04-28)"整段(含 4-pillar 现状对照表 + Govern 三件套预警 4 条 + ADK graph-based 三向分叉表);frontmatter sources 加 google-agent-platform raw;相关概念加 google-agent-platform;updated → 2026-04-28concepts/google-tpu-v8— "DeepSeek V4 模型侧回应"段后新增"TPU 8t / 8i:v8 训练-推理拆分的延续(2026-04-22 同期宣布)"整段(含 8t 训练 SKU 详细表 + 8i 推理 SKU 详细表 + 含义 4 条 + Anthropic 3.5 GW anchor + MediaTek 股价反应);frontmatter sources 加 raw / updated 2026-04-28;相关概念加 google-agent-platformconcepts/training-inference-bifurcation— "TPU 8t/8i 进一步实证(2026-04-22 同期)"整段插入 platform-layer-collapse 关系段前(含 v7→v8→8t/8i 三代连续路线判断 + AWS vs Google 路线对照);frontmatter sources 加 raw / updated 2026-04-28;相关概念加 google-agent-platformconcepts/claude-agent-sdk— "行业第二独立样本:CREAO" 段前新增"同类对标:Google ADK(Agent Development Kit)"整段(含两个 SDK 7 维度对比表 + ADK 2026 graph-based 升级行业含义 + 三种 agent 编排路径表 + Sentino 当前不必跟随 graph 化判断);frontmatter sources 加 raw / updated 2026-04-28;相关概念末尾加 google-agent-platformconcepts/agent-creator-refiner-operator— "Devin / Manus 反例"段前新增"Google Agent Platform:Creator + Refiner 平台典型实例(2026-04-22)"整段(含三元论位置 vs Google AP 组件对应表 + 为什么 Google 不做 Operator 的 Liability Wall + Integration Moat 解释 + 对四类中间层公司影响表);frontmatter sources 加 raw / updated 2026-04-28;相关概念末尾加 google-agent-platformconcepts/mcp-protocol— "平台基础设施层渗透:Agora ConvoAI" 段前新增"Google Agent Gateway 多协议中 MCP 享有特殊地位(2026-04-22)"整段(含四协议授权策略支持对照表 + Layer 1-4 渗透阶梯升级表 + 对 Sentino "server 端暴露 MCP 也开始有差异化收益"判断);frontmatter sources 加 raw / updated 2026-04-28;相关概念末尾加 google-agent-platformconcepts/orchestration-free-agents— 末尾相关概念前新增"反方向证据:行业头部正在押显式编排(2026-04 Google ADK 升级)"整段(含 4 种 agent 复杂度管理路径对照表 + Carlini "无编排" 哲学的边界 + 对 Sentino 的具体含义"当前不必跟随 ADK graph 化");frontmatter sources 加 raw / updated 2026-04-28;相关概念加 google-agent-platform + amphiflow-patternwiki/index.md— 「AI / Agent 工程 → Agent 框架与架构」章节末尾加 google-agent-platform 一行;最近更新加一条 2026-04-28(单行硬约束)
事实核查记录¶
- WebFetch Google Cloud 官方公告 https://cloud.google.com/blog/products/ai-machine-learning/introducing-gemini-enterprise-agent-platform → 4 pillars 是 Build/Scale/Govern/Optimize(不是 create/scale/govern/optimize)——上次 google-memory-bank ingest journal 写错为 "create",本次摄取必须修正
- WebFetch 同上 → Vertex AI 没有具体 sunset 日期("all Vertex AI services and roadmap evolutions will be delivered exclusively through the Agent Platform" + 用户素材里"6-24 停更"未在官方公告核实,本次摄取不重复未核实日期)
- WebFetch 同上 → Model Garden Anthropic 系列仅泛指 "Anthropic Claude Opus, Sonnet, Haiku",没具体到 4.7 版本号——表述改为"Anthropic Claude 系列"
- WebFetch 同上 → Grok 在 4-22 Cloud Next Model Garden 公告中没核实到——剔除该条
- WebFetch 同上 → TPU 8t/8i 在这篇博客里没提(同期单独宣布,详见独立 WebSearch)
- WebSearch "Google Cloud Next 2026 TPU 8t 8i Sunfish Zebrafish" → 完全核实 8t Sunfish Broadcom 9600 chip / 121 FP4 EFLOPS/pod / 8 stacks 12-high HBM3e / TSMC 2nm / Anthropic 3.5 GW anchor 2027 上线;8i Zebrafish MediaTek 10.1 FP4 PFLOPS/chip / 384 MB on-chip SRAM / 288 GB HBM / 8.6 TB/s / 80% better perf-per-dollar / MediaTek 股价创纪录 TWD 2,090 daily limit;preview 2H 2026 / GA late 2027
- WebSearch "Google ADK Agent Development Kit 2026 graph-based subagent network" → 完全核实 ADK 重大升级 = graph-based 子 agent 网络 / google-adk PyPI 2026-04-21 发布 / ADK v1.0 stable 跨四种语言 / 与 BigQuery + Pub/Sub 集成 / 与 MCP 集成
- WebSearch "Google Agent Identity DPoP mTLS cryptographic" → 完全核实 Agent Identity 基于 SPIFFE 标准 + X.509 证书 + mTLS + DPoP + Service Account 不能 impersonate + 不允许长期 key + Credential Vault;"Active Directory for AI era" 是行业评论不是 Google 官方表述
- WebSearch "Google Agent Gateway air traffic control MCP" → Thomas Kurian 称"air traffic control for your agent ecosystem" ✅;preventative enforcement before action ✅;支持 MCP / A2A / REST / gRPC 多协议 ✅;只有 MCP 支持基于 protocol attribute 的授权策略条件(精确表述);"default-deny" 用户素材这么说,精确表述应是 "least-privilege permissions" + "preventative enforcement before action"
- WebSearch "Google Agent Platform Memory Bank Memory Profiles" → 核实 Memory Profiles 是 Memory Bank 的子能力(schema-based structured profiles 用 Pydantic 定义 + 低延迟召回 + scope 隔离),不是平行 Scale 柱组件;Memory Bank + Sessions 已 GA + 2026-01-28 起按 $0.25/1K events 计费
- WebSearch "Google Model Garden 2026 Cloud Next" → 核实 200+ 模型 + Anthropic Claude / Gemma / Llama / DeepSeek(R1 / V3 / V3-0324 with H200 + vLLM)/ Mistral Small 3.1;Grok 没核实到
- 客户文档陷阱检查:本素材是用户网络调研后产物(不是客户向 PRD/RFP/提案/合同),不触发该专项检查。素材中提到的 GCP / Anthropic / Microsoft / OpenAI 都是行业横向引用,不是客户已选型问题
与同期 wiki 的时点关系¶
- 2026-04-28 三次摄取(早 Karri Saarinen / 中 Memory Bank / 晚 Agent Platform 父概念)形成完整的"产品哲学(Saarinen)/ 单组件(Memory Bank)/ 父平台(Agent Platform)"三层证据栈。Saarinen "AI 公司是 backend 类、UNIX composability"判断与 Google Agent Platform 18 组件全栈形成有趣张力——backend 类 + composability 主张是反全栈的,Google Agent Platform 一次性内化 18 组件是反 composability 的。两者不矛盾:Google AP 是企业内部 backend 全栈整合(治理 + 优化必须紧耦合),Saarinen 主张是 product 公司间的 UNIX 风格协作(每家公司只做一件事)。判断维度不同——所以可以同时接受 Saarinen "Sentino 应该 backend 类" 主张 + Google "企业 agent 平台必须全栈一体" 实证
- Google Agent Platform 是 2026-04 头部模型公司"agent platform 化"趋势的最完整产品形态:Anthropic Claude Cowork(research-preview-pattern)/ Walmart agentic AI 战略(agent-creator-refiner-operator Refiner+Operator 实证)/ Google Gemini Enterprise Agent Platform,三家头部不约而同把"agent 平台"作为产品形态独立成一级——Sentino Agent 平台的方向判断在头部公司战略上有三方独立同源验证
元观察¶
- 本次是知识库第一次"父概念追加摄取修正子概念定位"的标准模板 — 4-28 早摄取 google-memory-bank 时把单组件当独立概念处理(信息不全所致),4-28 晚摄取父概念后用顶部引用框 + 父概念回连方式修正子概念定位,不删原内容(保留概念页本身的能力描述价值)。这是一种新的修正模板:当后续发现某个 concept 实际是更大概念的子节点时,加引用框 + 回连即可,不需要重写。下次类似情况("我建了个独立页结果发现是 X 的子组件")可参考
- 同日 ingest 修正前一次 ingest 事实错误的标准模板 — 4-28 早摄取的 4 pillars "create" 错误在同日晚摄取时通过:(a) 早段保留原条 + 加注脚说明错误轨迹(不删);(b) 晚段开头明确说"修正上次摄取的事实错误",引用 WebFetch 原文。不删原条 + 透明记录错误轨迹比"重写历史"更符合知识库累积本质。下次发现历史 ingest 事实错误可参考此模板
- Agent Platform 4 pillars 给 wiki 加一个对照框架 — 之前讨论"Agent 平台"时缺一个标准词汇结构,现在有 Build / Scale / Govern / Optimize 4 柱可作为对照轴(Sentino 自检 / 客户调研 / 销售物料 / 行业对比)。这个框架不是 Sentino 必须遵守的本体论——是 Google 商业化框架,借鉴用于内部对齐和销售物料的对照可以,但 Sentino 对外不应被动接受 Google 词汇定义自己(适用边界已写入 google-agent-platform 页)
待办¶
- 跟踪 ADK graph-based 子 agent 编排在企业内的实际渗透(vs LangGraph)— 决定 Sentino 是否在某个时点要补 graph-based 子 agent 能力
- 跟踪 Agent Identity SPIFFE + X.509 是否成 B2B Agent 集成 RFP 标准 — 如果 Hotmind 后续 RFP 或新客户要求 agent SPIFFE 身份,Sentino 需要应对方案
- TPU 8t late 2027 GA 时回访 Anthropic 3.5 GW 部署对 Claude 模型路线的影响
- 跟踪 Memory Bank GA 后第一个公开企业客户案例(Payhawk 已是早期实证,需要看更多)
- Sentino 销售材料是否要补"治理路线图"段——客户问起 Govern 三件套时的回答框架(与 2026-04-28-memex-v2-design-options P1 Memory revisions API + IAM 协同推进)
- 评估是否要新建独立的
concepts/agent-governance-trio子页面(Identity + Registry + Gateway 模式)— 当前判断是暂不独立成页,作为 google-agent-platform 页内 Govern 柱子节即可。触发独立成页的条件:(a) 出现第二个独立证据点(如 Microsoft Agent 365 Entra ID 详细资料 ingest);(b) 客户场景需求明确要求 Sentino 实现该模式