Agora RTC AI 语音对话

tags: [IoT, Agora, RTC, AI语音, 实时通信]
created: 2026-04-12
updated: 2026-05-07
sources: [raw/snippets/iot-docs/guide-ai-voice.md, raw/snippets/iot-docs/architecture-technical.md, raw/snippets/agora-rtsa/implement-transmission.md, raw/notes/openai-webrtc-relay-transceiver-2026-05-04.md]

定义¶

基于 Agora RTC SDK 实现的设备端 AI 实时语音对话能力。设备通过 MQTT 获取 RTC 参数后加入 Agora 频道，与云端 AI Agent 进行低延迟语音交互。

关键要点¶

对话生命周期：Idle → Requesting（MQTT 上报）→ Joining（初始化 SDK）→ InCall（音频收发）→ Leaving → Idle
设备只需做两件事：发 agora_agent_device_access MQTT 消息 + 用返回的 4 个参数（appId/rtcToken/channelName/uid）加入频道
音频参数：OPUS 编码、16kHz 采样率、单声道、16bit PCM、20ms 帧长（这一组参数本质来自 agora-rtsa-sdk SDK 的发送约束——不是某个产品决定的，而是 RTSA C SDK 传输 API 的硬约束：(640 × 1000) / (16000 × 1 × 2) = 20ms，发送间隔必须等于帧长）
AI Agent 先就绪：云端先创建 Agent 并让其加入频道等待，设备加入即可开始对话
结束时零成本：设备调用 leave_channel() 即可，无需额外 MQTT 消息，云端自动清理
NFC 切换角色：通过 agora_agent_nfc_report 上报 NFC 标识，onlyReport=0 时切换角色并开始对话
数据流：设备音频 → Agora → ASR 识别 → HTTP Callback 到 Sentino Agent → LLM 推理 + TTS → SSE Streaming 返回 → Agora → 设备播放
断连重连：先用旧参数重连，失败后重新请求 agora_agent_device_access 获取新参数
SDK 优化：频繁对话场景可只初始化一次 SDK，每次只调 join/leave

信息论视角¶

音频参数的选择本质上是信息论权衡：Opus 编码在 16kHz 采样率下的比特率选择反映了信源编码定理的约束——压缩不能低于语音信号的熵率。而无线信道（Wi-Fi/BLE）的吞吐量受 Shannon-Hartley 公式 C = B log₂(1+S/N) 硬约束，IoT 设备的低功耗需求意味着工作在功率受限区。（→ information-theory）

同源问题、不同自建/外包姿态：OpenAI Global Relay 对照¶

OpenAI 2026-05-04《How OpenAI delivers low-latency voice AI at scale》披露了其 in-house WebRTC 栈架构（openai-webrtc-relay-transceiver）。Sentino 走 Agora SD-RTN（多租户）vs OpenAI 自建 Global Relay = 同一类问题在不同规模阶段的两种解：

Agora 给 Sentino 屏蔽掉了什么：split relay + transceiver 拆分 / ICE ufrag 编路由 / Cloudflare geo steering / Pion + Go + SO_REUSEPORT 调优 / Kubernetes 大段 UDP 端口管理——这些工程量 Agora 替所有 RTC SDK 客户做了
触发自建的规模阈值：OpenAI ChatGPT voice 服务 900M+ WAU；Sentino 远低于此，自建无意义
架构形态差异：Sentino 当前用 Agora ConvoAI 的 "AI as participant in SFU" 模型（Agent 在频道里以参与者身份加入）；OpenAI 明确说 SFU 是大多数客户的 default 起点，但 1:1 latency-sensitive workload 应该走 transceiver 模型——当某个 Sentino 客户的并发与延迟敏感度大幅升高时（重度 barge-in 场景），是否需要从 SFU 迁移到 transceiver 模型 = 长期 watching point

定义¶

关键要点¶

信息论视角¶

同源问题、不同自建/外包姿态：OpenAI Global Relay 对照¶

相关概念¶