Anthropic 在 2026 年 2 月 5 日推出 Claude Opus 4.6,编码、推理与日常工作任务能力全面增强,首度支持 1M token 上下文窗口(beta),在 Terminal-Bench 2.0 与 Humanity's Last Exam 等基准上取得最高分,定价不变。
2026 年 2 月 5 日,Anthropic 宣布推出其最强模型 Claude Opus 4.6。新模型在编码能力上显著提升:规划更谨慎、能更长时间维持代理任务、在更大代码库中更可靠地运行,并具备更好的代码审查与调试能力以自我纠错。这是 Opus 系列首次引入 beta 版 100 万 token(1M)上下文窗口。
Claude Opus 4.6 在多项评估中取得业界领先成绩:在代理编码测试 Terminal-Bench 2.0 上获得最高分;在复杂多学科推理测试 Humanity's Last Exam 上超越所有前沿模型;在面向金融、法律等领域经济价值知识工作的 GDPval-AA 评估中,比 OpenAI GPT-5.2 高出约 144 Elo 分,比前代 Opus 4.5 高出 190 分;在衡量模型定位难找在线信息的 BrowseComp 上也优于其他模型。
模型还扩展了日常生活工作任务能力:财务分析、研究、文档/电子表格/演示文稿的创建与使用均得到强化。在 Cowork 模式中,Claude 可自主多任务。此外,Claude Code 现支持组建代理团队协作;API 端引入上下文压缩机制以延长任务执行,新增自适应思考(根据上下文线索决定思考深度)与新的 effort 控制选项,让开发者灵活调节智能、速度与成本。Excel 功能大幅升级,PowerPoint 支持以研究预览形式开放。
Claude Opus 4.6 即日起可通过 claude.ai、API 及主流云平台使用。开发者在 API 中调用 claude-opus-4-6,价格保持不变(输入 $5/百万 token,输出 $25/百万 token)。更多细节及安全评估详见官方公告。
原文链接: https://www.anthropic.com/news/claude-opus-4-6