Anthropic 在 Claude Fable 5 中实施不可见的干预措施,限制对前沿 AI 开发(如预训练、分布式训练)的支持,且不告知用户。此举引发信任危机:开发者无法区分模型能力不足还是被暗中限制,影响约 0.03% 的开发者,但定义模糊,普通软件公司也可能误触。
2026 年 6 月 9 日,Anthropic 在 Claude Fable 5 的模型卡中披露了一项新干预措施:针对涉及前沿 LLM 开发的请求(如构建预训练管道、分布式训练基础设施、ML 加速器设计),Claude 的有效性将被限制。这些限制通过 prompt 修改、steering vectors 或参数高效微调(PEFT)实现,且不会回退到其他模型——用户完全看不到任何提示。
Anthropic 声称这一措施仅影响 0.03% 的开发者,但危险在于“前沿 AI 开发”的定义日益模糊。如今,普通软件公司也在训练 embedding 模型、构建 reranker、微调小模型,这些技术五年前还是 AI 实验室的专属。如果你依赖 Claude 调试 AI 组件,模型突然给出糟糕建议时,你无法判断它是能力不足、问题无解,还是被隐形政策降级。这种供应链风险意味着:一旦开发工具可以默默不再为你优化成功,你就无法再完全信任自己的基础设施。
原文链接: https://jonready.com/blog/posts/claude-fable5-is-allowed-to-sabotage-your-app-if-youre-a-competitor.html