GPT-Bidi-1 曝光:OpenAI 双向实时语音,终结「对讲机式」AI
2026-06-24 13:00:00
GPT-Bidi-1 技术前瞻
问题
现有语音 AI:轮流说话(walkie-talkie)——用户说完 → AI 再说
GPT-Bidi-1
| 能力 | 说明 |
|---|---|
| Full-duplex | 边听边说 |
| Barge-in | 即时吸收 打断 |
| Knowledge cutoff | ~2025/8 |
| 底座 | 疑基于 GPT-5.4 轻量化 |
与 GPT-5.6 关系
- kindle-alpha 在 Codex 候选发布名单
- 传闻 6/26(周四) 同期发布
- GPT-5.6 Pro:视觉复刻、UI 生成、Agent 工作流
商业背景
- ChatGPT 份额 首次 <50%(46.4%)
- OpenAI IPO 前 需 产品强心剂
架构含义
GPT-5.6(文本/Agent) + GPT-Bidi-1(实时语音)
↓
ChatGPT 统一体验层
审慎
全部为泄露——以 官方 demo/system card 为准。
对比
- OpenAI gpt-realtime-2(6 月已发 Whisper 路线)
- Google Gemini Live
- GPT-Bidi-1 = 真·全双工 下一代