Google DeepMind 发布 Gemini Robotics 1.5:机器人「会思考」且跨形态迁移

2026-06-14 19:00:00

Google DeepMind 发布 Gemini Robotics 1.5 系列,为机器人和具身智能打造新一代「大脑」。

模型家族

模型 定位
Gemini Robotics 1.5 视觉-语言-行动(VLA),将视觉与指令转化为运动控制
Gemini Robotics-ER 1.5 视觉-语言推理,规划多步骤任务、调用搜索等工具

关键突破

  1. 任务前思考:执行前先规划,可用自然语言解释决策,提升透明度
  2. 跨具身学习:从一个机器人学到的动作可迁移到另一形态,无需每种形态单独训练
  3. ER + 执行协作:ER 模型生成逐步自然语言指令,1.5 模型负责执行

行业意义

Gemini Robotics-ER 1.5 在 OSWorld 等基准表现领先,Google 将 基础模型 + 机器人控制 深度整合,加速具身智能从实验室走向产线场景。