Anthropic 发布研究,显示 AI 正越来越多自主参与自身开发,工程师每季度代码提交量达此前 8 倍,任务可靠完成时长每 4 个月翻倍。若趋势持续,2027 年 AI 可完成需数周的人类任务。递归自我改进潜力巨大,但也带来失控风险。
Anthropic 于近日发布研究报告(2025年),详细阐述了 AI 系统在自身开发周期中扮演越来越自主角色的趋势——即“递归自我改进”。报告显示,Anthropic 工程师当前每季度提交的代码量是 2021-2025 年期间平均水平的 8 倍。AI 能够独立完成的任务时长正在加速增长:从 2024 年 3 月 Claude Opus 3 的 4 分钟任务,到 2025 年 3 月 Claude Sonnet 3.7 的 1.5 小时,再到 2026 年 Claude Opus 4.6 的 12 小时任务——可靠任务长度每 4 个月翻倍(此前为每 7 个月)。如果这一趋势保持,今年内 AI 可能能完成人类需要数天的任务,2027 年则能达到数周量级。
为何值得关注?这不仅是技术指标,更指向 AI 开发范式的根本转变:从人类全程驱动,到逐步“闭环”自我改进。Anthropic 指出,若趋势足够远且算力充足,可能产生完全自主设计继任者的 AI 系统。这在科学、医疗等领域可带来巨大好处,但也会显著增加人类失去控制的风险,使得安全监控、行为塑造等变得至关重要。外部基准(如 SWE-bench)已在两年内从个位数得分饱和到接近 100%,CORE-Bench 也显示模型正逐步具备复现研究的能力。这些数据意味着递归自我改进可能比大多数机构预期的更早到来。
原文链接: https://www.anthropic.com/institute/recursive-self-improvement