Google DeepMind 发布 Gemini Robotics 1.5:机器人「会思考」且跨形态迁移
2026-06-14 19:00:00
Google DeepMind 发布 Gemini Robotics 1.5 系列,为机器人和具身智能打造新一代「大脑」。
模型家族
| 模型 | 定位 |
|---|---|
| Gemini Robotics 1.5 | 视觉-语言-行动(VLA),将视觉与指令转化为运动控制 |
| Gemini Robotics-ER 1.5 | 视觉-语言推理,规划多步骤任务、调用搜索等工具 |
关键突破
- 任务前思考:执行前先规划,可用自然语言解释决策,提升透明度
- 跨具身学习:从一个机器人学到的动作可迁移到另一形态,无需每种形态单独训练
- ER + 执行协作:ER 模型生成逐步自然语言指令,1.5 模型负责执行
行业意义
Gemini Robotics-ER 1.5 在 OSWorld 等基准表现领先,Google 将 基础模型 + 机器人控制 深度整合,加速具身智能从实验室走向产线场景。