Hacker News2026年6月6日

Anthropic 发布 Claude Opus 4.6：编码能力大幅提升，1M token 上下文窗口，多项基准领先

Anthropic 在 2026 年 2 月 5 日推出 Claude Opus 4.6，编码、推理与日常工作任务能力全面增强，首度支持 1M token 上下文窗口（beta），在 Terminal-Bench 2.0 与 Humanity's Last Exam 等基准上取得最高分，定价不变。

事件详情

2026 年 2 月 5 日，Anthropic 宣布推出其最强模型 Claude Opus 4.6。新模型在编码能力上显著提升：规划更谨慎、能更长时间维持代理任务、在更大代码库中更可靠地运行，并具备更好的代码审查与调试能力以自我纠错。这是 Opus 系列首次引入 beta 版 100 万 token（1M）上下文窗口。

Claude Opus 4.6 在多项评估中取得业界领先成绩：在代理编码测试 Terminal-Bench 2.0 上获得最高分；在复杂多学科推理测试 Humanity's Last Exam 上超越所有前沿模型；在面向金融、法律等领域经济价值知识工作的 GDPval-AA 评估中，比 OpenAI GPT-5.2 高出约 144 Elo 分，比前代 Opus 4.5 高出 190 分；在衡量模型定位难找在线信息的 BrowseComp 上也优于其他模型。

模型还扩展了日常生活工作任务能力：财务分析、研究、文档/电子表格/演示文稿的创建与使用均得到强化。在 Cowork 模式中，Claude 可自主多任务。此外，Claude Code 现支持组建代理团队协作；API 端引入上下文压缩机制以延长任务执行，新增自适应思考（根据上下文线索决定思考深度）与新的 effort 控制选项，让开发者灵活调节智能、速度与成本。Excel 功能大幅升级，PowerPoint 支持以研究预览形式开放。

Claude Opus 4.6 即日起可通过 claude.ai、API 及主流云平台使用。开发者在 API 中调用 claude-opus-4-6，价格保持不变（输入 $5/百万 token，输出 $25/百万 token）。更多细节及安全评估详见官方公告。

原文链接: https://www.anthropic.com/news/claude-opus-4-6

参考来源

查看原始公告 →

https://www.anthropic.com/news/claude-opus-4-6

事件详情

原文链接: https://www.anthropic.com/news/claude-opus-4-6