OpenSkill:无目标监督的开放世界 Agent 自进化框架

2026-06-17 04:00:00

OpenSkill(arXiv:2606.06741)研究 开放世界自进化:Agent 仅获任务提示,须从开放资源 自建技能 + 自建验证信号训练阶段零目标监督

核心流程

  1. 从文档、GitHub 仓库、网页获取 Grounded Knowledge
  2. 合成可迁移 Skills
  3. 基于自构建 Virtual Tasks 精炼技能(非目标答案)

实验结果

  • 三个基准 + 两个目标 Agent 上 自动化通过率最优
  • Skills 跨模型迁移,无需模型特定适配
  • 自构建 Verifier 与 ground-truth 高度对齐(训练时未见)

工程意义

现有 Self-evolving Agent 多假设已有 成功轨迹、Verifier 或 Curated Skills;OpenSkill 面向 真实部署后冷启动 场景——只有 prompt、没有标注数据。

状态

GitHub OpenLAIR/OpenSkill 已公开论文与路线图,完整代码分批释出

适用场景

  • 企业内部 新系统/onboarding Agent
  • 长尾工具 零样本接入
  • 研究 无监督 Agent 对齐 边界