OpenAI WebRTC语音对话工具新增文档上下文功能

原标题：OpenAI WebRTC Audio Session, now with document context

TL;DR · 一句话结论

开发者Simon Willison更新了其WebRTC音频对话工具，现在支持OpenAI最新的GPT-Realtime-2模型，并且允许用户粘贴文档内容，让AI在对话中引用文档信息。

SSimon Willison2026年6月13日 07:53约 2 分钟阅读↗ 查看原文

主要内容

OpenAI WebRTC API允许开发者构建实时音频对话应用。Simon Willison最初在2024年12月创建了一个演示工具。今年OpenAI推出了GPT-Realtime-2模型，但尚未在ChatGPT iPhone应用中提供，因此作者更新了该工具以支持新模型和文档上下文功能。

对于AI工具用户，这一更新提供了一种低成本试验OpenAI最新语音模型的方式，并首次实现了在浏览器中直接上传文档进行语音对话，适用于文档分析、会议准备、研究讨论等场景。

🇨🇳

对中国用户与市场

国内用户需通过开发者渠道使用OpenAI API，存在网络限制和付费障碍，但该工具的开源性质（代码可自部署）可能部分绕过限制，仍需自行处理API key和合规问题。

⚠尚未确定的部分

→可采取的行动

our first voice model with GPT‑5‑class r

#OpenAI#GPT-Realtime-2#WebRTC#Simon Willison#Coral#tools.simonwillison.net#实时音频#文档对话#OpenAI API#语音模型

🤖 本文根据 Simon Willison 的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。