Hacker News2026年6月6日

Claude Code 2月更新后复杂工程任务不可用，数据分析指向思维红化导致退化

用户反馈 Claude Code 在 2 月更新后无法胜任复杂工程任务。基于 6,852 个会话日志的分析显示，Anthropic 推出的思维内容红化机制使模型思考深度骤降，工具使用从研究优先转为编辑优先，质量明显下降。

事件详情

发生了什么

Anthropic 的编程助手 Claude Code 在 2 月更新后，被用户反馈对于复杂工程任务已不可用。该 issue 由账号 stellaraccident 于 2026 年 4 月 2 日在 GitHub 上提交（HN 热度约 800 点）。用户指出，Claude 的指令遵循能力、修复正确性、任务完成可靠性均出现退化，与 1 月表现相比落差明显。

为什么值得关注

用户团队挖掘了数月日志，定量分析了 17,871 个思维块和 234,760 次工具调用，覆盖 6,852 次会话。分析表明，Anthropic 在 2 月 12 日左右开始推行的“思维内容红化”（think-content redaction）机制是退化的直接原因。从 2 月 12 日至 3 月 12 日，思维可见性从 100% 骤降至 0%，与此对应的是模型思考深度的 Pearson 相关系数达 0.971。当思考深度降低后，Claude 的工具使用模式从“先研究再编辑”转变为“直接编辑”，导致质量滑坡。社区于 3 月 8 日独立报告了退化，恰好与红化比例超过 50% 的时间点吻合。

该问题对使用 Claude Code 进行大型工程重构、多步骤工作流的开发者影响重大。用户强调“扩展思考对于高级工程工作流是承重结构”，而非锦上添花。

原文链接: https://github.com/anthropics/claude-code/issues/42796

参考来源

查看原始公告 →

https://github.com/anthropics/claude-code/issues/42796

事件详情

发生了什么

为什么值得关注

该问题对使用 Claude Code 进行大型工程重构、多步骤工作流的开发者影响重大。用户强调“扩展思考对于高级工程工作流是承重结构”，而非锦上添花。

原文链接: https://github.com/anthropics/claude-code/issues/42796