2026-05-07 变更日志¶

摄取 OpenAI《How OpenAI delivers low-latency voice AI at scale》¶

来源：raw/notes/openai-webrtc-relay-transceiver-2026-05-04.md（OpenAI 官方工程博客 https://openai.com/index/delivering-low-latency-voice-ai-at-scale/，作者 Yi Zhang + William McDonald，发布 2026-05-04；直访 403 经 web.archive.org 抓取）

新建页面¶

concepts/openai-webrtc-relay-transceiver — 核心架构页。完整三约束（K8s 不适合 one-port-per-session / ICE+DTLS 状态粘性 / first-hop 全球低延迟）+ 4 候选方案对照表 + 为什么 SFU-less 选 transceiver（1:1 latency-sensitive workload）+ 首包路由（ICE ufrag 编路由元数据）+ Global Relay + Cloudflare geo steering + relay Go 实现细节（SO_REUSEPORT + runtime.LockOSThread + 不上 kernel bypass）+ 与 Sentino 路径对照表 + 反常识/工程细节 + SFU 迁移到 transceiver 模型 Sentino 视角具体对比（17 维度对比表 + 三类硬触发场景 + 三步渐进式迁移路径 + 5 类预警信号"Watch 而不 Act"）

关键知识提取¶

OpenAI 把"路由"与"协议终止"切两层：无状态 relay（小公网 UDP footprint + 全球 PoP + 仅读 STUN ufrag 转发）+ 有状态 transceiver（持 ICE/DTLS/SRTP/编解码协商 + 与推理后端简化协议）。客户端跑标准 WebRTC 完全无感 → 与 agora-rtsa-sdk 的连接：新增"SDK 边界设计的同构案例"整段——relay/transceiver 拆分 = "服务端必须每跳都做完整 WebRTC 终止吗？"，与 RTSA 把"采集 + 编解码"踢出 SDK 是同源的边界判断；这给"为什么 Agora SD-RTN 这类多租户服务有结构性价值"加反向证据（OpenAI 在 900M WAU 规模重做这件事的工程量极大 = Agora 替所有客户屏蔽掉的工作）
首包路由用 ICE ufrag 编路由元数据：服务端生成 ufrag 时塞够 destination cluster + owning transceiver 的提示，relay 解第一个 STUN binding request 即可路由。relay session 故意最小化（in-memory + Redis cache 优化重启），不查外部 lookup → 与 agent-tool-design 的连接：本概念页"在标准协议里塞自己语义、不引入新字段" 是协议设计范例，与 MCP 在 JSON-RPC 上塞自己协议同源
Cloudflare 用作 signaling 的 geo + proximity steering — OpenAI 明确说初始 HTTP/WebSocket 请求经 Cloudflare 路由到附近 transceiver cluster → 与 cloudflare-mesh 的连接：新增"OpenAI 也用 Cloudflare：geo / proximity steering 是另一种 default 形态（2026-05-04 新证据）"段——本页之前记录 Cloudflare = Agent 私有组网首选，新加一类形态：Cloudflare = 前沿 AI 公司用作边缘 DNS / proximity routing 层的 default。Anthropic + OpenAI 都在 Cloudflare 多层产品上做基础设施，"前沿 AI 公司基础设施 default = Cloudflare 多层产品组合"判断进一步加强
relay 实现是窄 Go + Linux socket 调优 + 故意不上 kernel bypass：SO_REUSEPORT 多 worker bind 同 UDP 端口、runtime.LockOSThread 钉 goroutine 到 OS 线程、预分配 buffer 避免 GC。"对我们的 workload 已经够用" → 与 first-principles-deletion 的连接：双重应用——"服务端这一层必须做完整 WebRTC 终止吗？"（relay 删协议终止）+ "必须用最复杂的 kernel bypass 吗？"（窄 Go + SO_REUSEPORT 已够用）；与 harness-engineering 的连接："thin routing layer + thick stateful terminator" 是 Harness "分层处理不同保质期信息" 原则在 RTC 媒体平面的应用
"对话动态"维度的产品体感下限是被网络栈决定的，不是被模型决定的 — OpenAI 把 first-hop 优化放在三大要求第一位，原文："When the network gets in the way, people hear it immediately as awkward pauses, clipped interruptions, or delayed barge-in" → 与 voice-presence 的连接：新增 "对话动态的下限是网络栈，不是模型" 段——CSM / Mimi codec 等模型层临场感工作要落地到产品体感，必须有低延迟传输栈托底；模型再好，first-hop 200ms 也救不回来
Sentino 当前 SFU 形态 vs OpenAI transceiver 形态的迁移成本对比是 17 维度差异（具体见新概念页"SFU 迁移到 transceiver 模型"段），核心结论：每一种"必须迁移"的硬触发点（高并发 barge-in / E2E + 服务端 ASR / 数据主权）都有更便宜的中间方案缓解，OpenAI 走自建是因为 900M WAU 边际成本曲线让自建变成正向 ROI；Sentino 短中期没有任何场景能让自建 ROI 成立。本节存在的意义是给"什么时候该评估" 一个明确清单（5 类预警信号），不是建议现在动 → 与 sentino-agent 的连接：相关概念加一行"长期 watching point"；与 agora-rtc-voice 的连接：新增"同源问题、不同自建/外包姿态：OpenAI Global Relay 对照"段（Agora 给 Sentino 屏蔽掉了什么 + 触发自建的规模阈值 + 架构形态差异 + watching point）
Pion 创建者 Sean DuBois + WebRTC 原始架构师 Justin Uberti 都在 OpenAI — 标准协议生态侧的关键人物物理上集中 → 与 mcp-protocol 的对照：Anthropic 在 MCP 协议层 vs OpenAI 在 WebRTC 协议层的人才布局形态——前沿 AI 公司在协议层的人才聚拢是新观察到的模式（之前 wiki 只记录 Anthropic MCP 战略一侧）

更新页面¶

concepts/agora-rtc-voice — 新增"同源问题、不同自建/外包姿态：OpenAI Global Relay 对照"整段（Agora 给 Sentino 屏蔽掉的工程量 + 触发自建的规模阈值 + 架构形态差异 + watching point）；相关概念加 1 条新链接；sources 加新 raw；updated → 2026-05-07
concepts/agora-rtsa-sdk — 新增"SDK 边界设计的同构案例：OpenAI relay/transceiver 拆分"整段（同源逻辑论证 + 反向证据：OpenAI 自建工程量极大 = Agora 替屏蔽掉的工作）；相关概念加 1 条新链接；sources 加新 raw；updated → 2026-05-07
concepts/voice-presence — 新增 "对话动态的下限是网络栈，不是模型" 段（first-hop 决定 barge-in / turn-taking crispness）；相关概念加 1 条新链接；sources 加新 raw；updated → 2026-05-07
concepts/cloudflare-mesh — 新增 "OpenAI 也用 Cloudflare：geo / proximity steering 是另一种 default 形态（2026-05-04 新证据）" 段（前沿 AI 公司基础设施 default = Cloudflare 多层产品判断进一步加强）；相关概念加 1 条新链接；sources 加新 raw；updated → 2026-05-07
concepts/harness-engineering — 相关概念加 1 条新链接（Environment 层在 RTC 媒体平面的应用）；sources 加新 raw；updated → 2026-05-07
concepts/first-principles-deletion — 相关概念加 1 条新链接（双重应用：删协议终止 + 不上 kernel bypass）；sources 加新 raw；updated → 2026-05-07
projects/sentino-iot — 相关概念加 1 条新链接（同源问题不同解的反向价值证据）；sources 加新 raw；updated → 2026-05-07
projects/sentino-agent — 相关概念加 1 条新链接（长期 watching point：SFU → transceiver 迁移条件）；sources 未改（项目页 sources 一般不滚动加 raw）
wiki/index.md — 「AI/Agent 工程 / Agent 框架与架构」段追加 1 条（openai-webrtc-relay-transceiver）；最近更新加 1 行 2026-05-07（单行硬约束）

事实核查记录¶

直访 OpenAI 原文 403 — curl 带 desktop UA 仍被 Cloudflare 拦（OpenAI 域名启用了 bot 防护）；改走 web.archive.org/web/2026/... 镜像抓到完整 459KB HTML；用 Python HTMLParser 提取出干净文本 281 行
关键事实保留：作者 Yi Zhang + William McDonald / Members of Technical Staff / 发布日 2026-05-04 / Engineering 分类 / 内嵌引用 6 条参考链接（Discord 250 万并发 / l7mp/stunner / mediasoup / LiveKit / Cloudflare Calls / BlogGeek.me WebRTC 端口）
数字唯一明确披露：900M weekly active users（这是 ChatGPT 整体的数字，不是 voice 专属）；其他延迟数字（首字 / RTT p50 / p95）全部未披露——文章定性"low and stable"未给数字
Pion + Justin Uberti + Sean DuBois 关系核实：Sean DuBois = Pion 创建者维护者；Justin Uberti = WebRTC 原始架构师之一。两人都在 OpenAI——这是文章原文明确说的，不是推测
未做 WebSearch 二次核实：本素材是 OpenAI 一手工程博客，事实密度高 + 营销密度极低 + 技术声明可被 WebRTC 标准 / Pion 仓库 / Linux man page（SO_REUSEPORT、runtime.LockOSThread 等）独立验证。WebRTC ufrag / DTLS / SRTP / Kubernetes UDP port 限制等都是公开技术事实，不需要二次源核实
客户文档陷阱检查：本素材是工程博客，不是客户向 PRD/RFP/提案/合同，不触发该专项检查。文中第三方品牌名（Pion / Cloudflare / Discord / LiveKit / mediasoup / Justin Uberti / Sean DuBois）都是事件主角或参考资料引用，不是客户技术选型问题

摄取者判断与原文 / wiki 现状的差异¶

#	项	原文表述	wiki 处理
1	触发自建的规模阈值	原文未明说"什么规模值得自建"，只说 OpenAI 自家 workload 三要求	wiki 在新概念页"与 Sentino 路径对照表"明确写入"OpenAI 900M+ WAU vs Sentino 远低于此"作为判断
2	SFU 是大多数客户的 default 起点	原文："Even in client-to-AI products, an SFU is often the default starting point because it lets teams reuse one proven system"	wiki 在概念页"为什么不是 SFU"段保留原文，并在"与 Sentino 路径对照"段把 Sentino 当前选 SFU 路径定位为"行业 default 起点"——印证 Sentino 路径选择不是落后
3	迁移成本是 17 维度差异	原文未做 SFU vs transceiver 迁移成本表	wiki 自构 17 维度对比表 + 三类硬触发场景 + 三步渐进式迁移路径，用户加 prompt "SFU 迁移到 transceiver 模型对比" 触发
4	E2E 加密 + 服务端 ASR 互斥被 transceiver 模型解决	原文未提 E2E 加密 / ASR 关系（这是 agora-rtsa-sdk 已有的 Sentino 视角分析）	wiki 在 17 维度对比表把这一项纳入——transceiver 模型让 trust 边界从 Agora 收回到 Sentino，ASR 与 E2E 不再互斥；但补充"有更便宜的中间方案"（设备端 ASR / 私有 ASR endpoint），不必为这一条迁移整套 RTC 栈
5	媒体面 RTT 数字	原文只定性"low and stable"，无具体数字	wiki 标注"待跟踪开放问题"——文章未披露 p50/p95，竞品对照需要

与同期 wiki 的时点关系¶

本次摄取与 5-06 PE-anchored FDE JV 是 frontier 模型公司战略风格的两面：5-06 摄取记录了 Anthropic / OpenAI 在资本架构 + 渠道战略层的对照（Anthropic 窄而战略 vs OpenAI 宽而资本密集）；本次摄取记录了 OpenAI 在底层基础设施工程层的具体投入。两次摄取拼出"OpenAI 战略风格 = 资本密集 + 自建 in-house 全栈"的更完整图景——OpenAI 在模型 / 资本 / 渠道 / 网络栈 4 层都选择"自己做大做全"，Anthropic 在 MCP 协议 / 窄客户线 / Research Preview 选择"挑客户做窄"。frontier 模型公司战略风格在 4 层一致是 wiki 第一次完整观察
本次摄取与 4-17 Agora 系列摄取（agora-rtc-voice / agora-rtsa-sdk / agora-convoai-server / agora-convoai-join-api）形成结构对照：4-17 摄取是"Sentino 站在 Agora SDK 视角看 RTC 基础设施"，本次是"OpenAI 站在自建栈视角看同一类问题"。两侧对照让 wiki 第一次有完整的"多租户 SDN 解 vs in-house Global Relay 解"对比框架——以前 wiki 只有 Sentino 一侧视角
Cloudflare 在 wiki 的累积证据加强：4-16 摄取 cloudflare-mesh 给出 Agent 私有组网视角；本次给出"前沿 AI 公司用 Cloudflare 边缘 DNS / proximity steering 做信令路由"新形态。Cloudflare 从"Agent 时代私有组网首选"扩展到"前沿 AI 公司基础设施 default 多层组合"

元观察¶

底层基础设施工程深度内容是 wiki 的相对盲点：wiki 之前 30+ 篇 raw 偏产品 / 战略 / 模型 / 创业者哲学 / 销售方法论 / 政策评论；网络栈 / Kubernetes 部署模型 / 跨 region 路由 / Linux socket 调优等深度工程内容只在 agora-rtsa-sdk / google-tpu-v8 / virgo-fabric / boardfly-topology 这几个硬件 / SDK 页有零散记录。本次摄取在网络栈方向加了一根专门支柱 openai-webrtc-relay-transceiver
"事件型 concept 页 + 与现有 concept 多向连接"模式效果好：本次只新建 1 页（不像 5-06 摄取建 4 页），但与 8 个现有 concept / project 建立双向连接（agora-rtc-voice / agora-rtsa-sdk / voice-presence / cloudflare-mesh / harness-engineering / first-principles-deletion / agent-tool-design / mcp-protocol + sentino-iot / sentino-agent）。单一 concept 页 + 多向回连比"事件页 + 辅助概念页 3 页"模式更适合"工程深度文章"类型素材——技术内容更聚合而非分散
与 wiki 现有 Sentino 视角形成深度对话：本次摄取的 17 维度 SFU vs transceiver 对比 + 5 类预警信号 + 3 步渐进式迁移路径，是 wiki 第一次给"长期 watching point" 加可操作的具体清单。之前的 watching point（如 "Goldman Sachs 在 Anthropic JV 的角色是否揭晓为 IPO 承销"）是观察项；本次是带"什么时候该评估" 明确触发条件的 watching list，更接近运营手册形态

待办¶

跟踪 Pion upstream 是否吸收 OpenAI 内部对 Pion 的修改 —— 决定 Sentino / 其他 WebRTC 玩家能否搭便车（Sean DuBois 在 OpenAI 内部对 Pion 的改动是否反向贡献回开源版本）
跟踪 OpenAI 后续是否披露 transceiver 与推理后端的"simpler internal protocols"具体形态（gRPC over QUIC？protobuf over HTTP/2？私有 binary？）—— 决定能否对照 Sentino 当前 ConvoAI HTTP callback 的内部协议设计
跟踪是否有第三方独立测量 OpenAI ChatGPT voice / Realtime API 的实际 RTT p50/p95 数字 —— 文章未披露，竞品对照需要
跟踪 Discord 是否会发同类工程深度博客 —— 文章引用的"Discord 250 万并发语音"是另一规模阈值参照点，Discord 的栈细节披露会进一步丰富对照
跟踪 Anthropic / Google 是否在 voice / 实时媒体方向有同等深度的工程公开 —— Anthropic 当前 voice 能力较弱，Google 走 Gemini Live + GCP Media，是否会有同类深度披露
跟踪 Cloudflare 是否会推出"针对 AI 实时媒体" 的专门产品打包 —— OpenAI 用了 Cloudflare 的几个独立能力（geo steering / DNS / WebSocket）拼出来的，Cloudflare 是否会把这些打包成一个产品（如 "Cloudflare Realtime AI Edge"）
Sentino 视角具体跟进：当前 sentino-tenga 的 E2E 加密 + 服务端 ASR 互斥问题是否需要重新评估迁移路径 —— 本次摄取给"自建 transceiver 模型 = trust 边界从 Agora 收回 Sentino" 提供了新视角；但本次摄取也指出"有更便宜的中间方案"，建议在与 Agora 工程支持沟通后再决定（agora-rtsa-sdk 待办段已记录）

新建报告 RTC 媒体供应商对比¶

报告：2026-05-07-rtc-media-vendor-landscape — 实时媒体基础设施供应商对比 Sentino 视角的 5 家选型

触发：用户在 ingest openai-webrtc-relay-transceiver 后追问"discord livekit 以及 cloudflare 的方案"，先在对话里给出口语化对比，用户进一步要求"整理一下，写成 report"。

新增的本报告独有判断（不写入 concept 页、报告独有）：

OpenAI 2026-05 文章 = 隐含宣布从 LiveKit Cloud 迁出——文章没明说但架构描述与 LiveKit Cloud 完全不兼容；LiveKit 官方博客 2024-10 + Series B 公告确认 ChatGPT Voice 2023-09 至 2026-05 期间跑在 LiveKit Cloud 上；本报告把这条潜台词显式化，是 wiki 第一次记录"前沿 AI 公司迁离合作基础设施供应商"的具体案例
LiveKit 是 Sentino "少依赖 Agora 单一供应商" 场景的最现实中间选项——4 维度论证：Pion 同栈 / 设计理念匹配（AI 作为参与者）/ OpenAI Realtime API 原生集成（hotmind-client 路径直接受益）/ 开源 + 商业双轨不被锁定
Sentino 选型决策树 6 个触发条件 + 各自推荐路径——可操作的运营手册形态，不是抽象判断
Cloudflare Realtime 改名 + 三件套结构（RealtimeKit + TURN + Serverless SFU 330+ 城市 anycast "无房间"track 级 pub/sub）——cloudflare-mesh 之外 Cloudflare 在 RTC 层的另一种 default 形态
当前 Sentino 状态：6 个触发条件没有任何一条出现——继续 Agora 是正确选择，但应主动准备触发条件 #1 / #4 / #6 的备选评估材料

对现有 wiki 判断的一致性核对（无修正、纯一致性确认）：

与 openai-webrtc-relay-transceiver "SFU 迁移到 transceiver 模型 Sentino 视角" 段一致——都说 Sentino 短中期不需要迁移
与 agora-rtc-voice "同源问题、不同自建/外包姿态：OpenAI Global Relay 对照" 段一致——都说 Agora 屏蔽掉了 Sentino 用不上的工程量
与 cloudflare-mesh "OpenAI 也用 Cloudflare：geo / proximity steering 是另一种 default 形态" 段一致——本报告把 Cloudflare 在 RTC 层能力进一步拆解
与 sentino-iot "硬件接入路径"段一致——本报告不挑战 BK7258 + RTSA Lite + ConvoAI 标准组合

事实核查记录：

WebSearch "LiveKit ChatGPT advanced voice mode OpenAI infrastructure partner" → 完全核实
时间线：2023-09 LiveKit + OpenAI 联合发布 ChatGPT Voice Mode；2024-10 正式 Partnership 包装 Realtime API；2026-01 LiveKit 估值冲到 $1B
LiveKit Cloud 是托管基础设施，OpenAI 把 LiveKit Client SDK 集成到 ChatGPT App
LiveKit 客户：Spotify / Meta / Microsoft / Character AI / xAI / Salesforce / Tesla / Speak / 911 / 心理健康服务
关键工程能力：buffered playback / 用户中断处理 / function calling 调度 / agent 健康监控 / load balancing
WebSearch "Cloudflare Calls renamed Cloudflare Realtime SFU WebRTC 2025" → 完全核实
2025 年改名：Cloudflare Calls → Cloudflare Realtime
当前包含：RealtimeKit（all-in-one SDK，2025 推出 beta）/ TURN Server / Serverless SFU
330+ 城市边缘网络 + Anycast WebRTC（BGP 自动决定最近 data center）
"No rooms" 设计哲学：直接控制 audio/video/data track，不强制房间抽象
HTTPS API for signaling + 单 PeerConnection per client

关键发现的潜台词推论：

LiveKit 2023-09 → 2026-05 跑 ChatGPT Voice + 2026-05 OpenAI 公开自建栈 → 这两个事实拼起来 = OpenAI 从 LiveKit Cloud 迁出。OpenAI 文章没明说，本报告显式化。这条对 Sentino 的含义不是"LiveKit 不行了"，而是"LiveKit 在 OpenAI 这种规模才需要迁出"——LiveKit 仍是中小规模 + Sentino 这种规模玩家的首选

待办：

跟踪 LiveKit 2026 后续融资 / 客户公告是否披露失去 OpenAI 主要 workload 的影响
跟踪 OpenAI 是否在后续公告里显式说明与 LiveKit 关系的当前状态
中国客户线 + 海外客户线占比变化触发触发条件 #6 评估的时机
触发条件 #2（E2E 加密 + 服务端 ASR）在 sentino-tenga / 其他敏感场景客户是否实际触发

元观察：

本报告是 wiki 第一次记录"前沿 AI 公司迁离合作基础设施供应商"的具体案例——之前 wiki 记录过 Anthropic / OpenAI 战略风格差异、平台层坍缩等，但没有"具体迁移事件 + 迁出方与迁入方都还在合作"这种细颗粒度案例
报告 + concept 页"双层叙事"模式第一次完整跑通：openai-webrtc-relay-transceiver 是中立 concept 页（可被未来引用），2026-05-07-rtc-media-vendor-landscape 是带 Sentino 立场的报告页（决策树 / 推荐 / 反建议）。两层分工清晰——concept 页不会被报告的立场污染，报告也不需要承担"未来其他事件引用"的中立叙事压力
报告"决策树 + 触发条件" 形态比"建议 P1/P2/P3" 形态更适合长期 watching point 类报告：2026-04-28-memex-v2-design-options 是"短期排期型"报告（用 P1/P2/P3），本报告是"长期 watching 型"报告（用决策树 + 触发条件）。两种形态可以共存于同一 reports 目录，未来可以总结报告的形态分类