- tags
- [AI, UI, 前端, Agent]
- created
- 2026-04-12
- updated
- 2026-04-12
- sources
- [raw/notes/bojie-li-agent-interaction.md]
定义¶
LLM 不仅生成内容,还生成界面本身的范式。Agent 向人类展示信息的最优方式——利用视觉通道的高带宽(~10 Mbps),而非文本或语音的低带宽。
关键要点¶
- 路径一:Web 前端代码生成
- Claude Artifacts:生成完整 React/HTML/CSS/JS 在沙盒预览渲染
- Google Generative UI(2025):三组件架构(服务器暴露工具 + 系统指令 + 后处理器),被人类压倒性偏好,44% 情况下与专家设计的网站相当
- 路径二:图像生成
- 适用于视觉资产、图表、概念插图、品牌资产
- 局限:难以处理长文本、缺乏交互性
- 最优方案:混合架构
- 长文本 → HTML/CSS 渲染
- 交互元素 → JavaScript/React
- 视觉资产 → 图像生成 API
- LLM 同时输出代码和图像生成指令,组合渲染
- 涌现能力:Google 评估中,Generative UI 的 ELO 分数(1710.7)超过顶级搜索结果,仅次于人类专家设计
- 与 seal-architecture 的关系:Agent→人 的最优输出通道,替代纯文本/语音输出
相关概念¶
- seal-architecture
- voice-presence
- agent-ui-is-product — UI 是 Agent 产品的核心差异化
- aesthetics-beyond-visual — 生成式 UI 能生成视觉层,但审美仍需人类决策