Anthropic 于 2026 年 5 月 28 日发布 Claude Opus 4.8,在基准测试全面超越前代,新增努力控制、动态工作流功能,快速模式降价 3 倍,已在上线且价格不变。
Anthropic 于 2026 年 5 月 28 日正式推出 Claude Opus 4.8。该版本基于 Opus 4.7 改进,在编程、Agent 能力、推理及知识工作等多个基准测试中均取得提升,即日起以相同价格提供服务。
Opus 4.8 同时上线多项新功能:用户可在 claude.ai 上控制模型对任务的“努力程度”;Claude Code 新增“动态工作流”(dynamic workflows)功能,使模型能处理超大规模问题;Opus 4.8 的快速模式速度提升至 2.5 倍,且价格比前代模型的快速模式便宜 3 倍。
早期测试者评价 Opus 4.8 在 Agent 任务中判断更可靠、更敏锐。在 Super-Agent 基准上,Opus 4.8 是唯一将所有案例从头到尾完成的模型,成本与 GPT-5.5 相当。在 CursorBench 上,各努力级别均超越前代;在 Legal Agent Benchmark 上取得最高分,成为首个在 all-pass 标准上突破 10% 的模型。计算机使用与浏览器 Agent 能力方面,Opus 4.8 在 Online-Mind2Web 上达到 84%,显著领先 Opus 4.7 和 GPT-5.5。
新版本被测试者形容为“重大生活质量升级”:更快速、更易协作,能在长会话中更好地保持上下文和风格。对于需要语音、品味与技术执行并重的工作,Opus 4.8 获得了高度信任。Anthropic 表示,该版本在工具调用、指令遵循等方面也表现更优,修复了 Opus 4.7 的评论冗长和工具调用问题。
原文链接:https://www.anthropic.com/news/claude-opus-4-8