用户反馈 Claude Code 在 2 月更新后无法胜任复杂工程任务。基于 6,852 个会话日志的分析显示,Anthropic 推出的思维内容红化机制使模型思考深度骤降,工具使用从研究优先转为编辑优先,质量明显下降。
发生了什么
Anthropic 的编程助手 Claude Code 在 2 月更新后,被用户反馈对于复杂工程任务已不可用。该 issue 由账号 stellaraccident 于 2026 年 4 月 2 日在 GitHub 上提交(HN 热度约 800 点)。用户指出,Claude 的指令遵循能力、修复正确性、任务完成可靠性均出现退化,与 1 月表现相比落差明显。
为什么值得关注
用户团队挖掘了数月日志,定量分析了 17,871 个思维块和 234,760 次工具调用,覆盖 6,852 次会话。分析表明,Anthropic 在 2 月 12 日左右开始推行的“思维内容红化”(think-content redaction)机制是退化的直接原因。从 2 月 12 日至 3 月 12 日,思维可见性从 100% 骤降至 0%,与此对应的是模型思考深度的 Pearson 相关系数达 0.971。当思考深度降低后,Claude 的工具使用模式从“先研究再编辑”转变为“直接编辑”,导致质量滑坡。社区于 3 月 8 日独立报告了退化,恰好与红化比例超过 50% 的时间点吻合。
该问题对使用 Claude Code 进行大型工程重构、多步骤工作流的开发者影响重大。用户强调“扩展思考对于高级工程工作流是承重结构”,而非锦上添花。
原文链接: https://github.com/anthropics/claude-code/issues/42796