Anthropic警告AI即将能够自我构建继任者

2026-06-04 16:00:00

Anthropic发布博文警告,AI系统正接近具备「递归自我改进」能力——即模型可参与构建更强版本的自身。

内部数据

公司披露超80%合并代码已由Claude生成,工程师日均合并量较2024年增长约8倍。员工估计启用Mythos Preview后个人产出约为未使用AI时的4倍。Claude Mythos Preview据称可连续运行超16小时,并在安全评测中发现超过1万个高危漏洞。

安全与治理

若自我改进循环成立,模型能力可能以约每4个月翻番的速度加速,这对AI安全评估、红队流程与监管框架提出前所未有的紧迫感。