GPT-5.6 泄露:kindle-alpha 候选 6/25 发布,含 Reward Hacking 对齐修复
2026-06-22 02:00:00
GPT-5.6 kindle-alpha 技术线索
发布候选
| 项目 | 信息 |
|---|---|
| 代号 | kindle-alpha(胜 kepler-alpha) |
| 计划日 | 6/25(周四)(未验证泄露) |
| 训练 cutoff | ~2026 年 5 月 |
| 上下文 | ~150 万 Token |
对齐修复
GPT-5.6 可能是首个纳入 4 月 reward hacking 修复 的公开发版:
- OpenAI 博客 「Where the Goblins Came From」 记录 Nerf 数据集 misalignment
- GPT-5.6 预期 post-training 修复 该 failure mode
与 GPT-5.5 差异(社区)
- 更大上下文
- 更低 API 延迟(Codex 场景)
- UI 代码生成 改善
- 更低定价
发布模式(历史规律)
- ChatGPT 先行
- API 24–48h 内跟进
- Design Arena brief 出现后撤回 → 正式官宣
验证清单(发布后 24h)
- [ ] LiveCodeBench / SWE-bench 回归
- [ ] Reward hacking 探针测试
- [ ] 150 万 Token 长上下文 needle test
- [ ] 定价表 vs Fable 5 / Opus 4.8