Claude Opus 4.1火速发布！坐稳编程之王，官方：马上还有大更新

明敏发自凹非寺
量子位 | 公众号 QbitAI

还是Claude痛快，Claude Opus 4.1前脚曝光，今天这就正式发了。

编程性能再次突破天花板，超越Claude Opus 4，拿下SOTA。

此外在Agent任务和推理方面进一步升级。

但加量不加价，定价和Claude Opus 4一样

官方说计划在未来几周对模型进行更大规模升级与改进，看来真就只是一次小更新，替代Opus 4。

实测用它做一个俄罗斯方块小游戏，提示词是“build the tetris game”，表现很稳。

有人觉得，Anthropic可能本来不想发模型，但是奈何GPT-5/Gemini-3的消息太多，为了保持市场竞争力所以先更新一波。

值得一提的是，Claude Opus 4.1这篇发布blog虽然简短，但是里面的心机可不老少——秀性能提升、秀客户关系、还变相证明自家模型真实好用。

现在的硅谷AI圈，真有意思哇。

明晒模型性能，暗秀客户关系

Anthropic首先晒了大家最关心的模型编程能力。

在SWE-bench上，Opus 4.1超越Opus 4、Gemini 2.5 Pro、o3，将性能提升至74.5%，拿下新SOTA。

同时还提升了深度研究和数据分析的技能，特别是在细节追踪和Agent检索方面。

其次，他们还找来客户做背书，邀请他们分享了内测中觉得Opus 4.1印象深刻的能力。既能体现自家模型在真实场景中好用，也暗暗秀了一把自己的客户订单。

根据GitHub给出的三方结果，Opus 4.1各个方面都较Opus 4有所改进，特别是在跨文件重构代码上，提升明显。

Rakuten Group（日本乐天株式会社）表示，Opus 4.1很擅长在大型代码库中精准定位、修复bug，且不需要进行不必要的调整、也不会产生新的bug，他们团队很喜欢在日常任务中使用这一功能。

Windsurf则表示，在初级开发基准测试中，Opus4到Opus 4.1的提升，和此前Sonnet 3.7到Sonnet 4的提升一样大。

这里插一句，因为亚历山大·王带团跳槽Meta，Windsurf剩余团队去向不明期间，Anthropic还断供了Windsurf一段时间，这应该是因为当时OpenAI要收购Windsurf。

如今随着Windsurf被Cognition收购，这种封锁已经解除，借着此次模型升级，Anthropic也算是亮明“大家还是好伙伴”的态度。

至于为啥找这么多客户来背书……前段时间GPT-5被泄露可不只有ChatGPT这边，还包括Cursor等合作平台，是故意的还是不小心不知道，但是OpenAI和谁合作大家都清楚了。Anthropic也想晒客户关系，也很正常。

最后，这篇Blog很简短，官方也明说就是小升级。

这种文风更受开发者们喜爱，毕竟隔壁的大忽悠实在是emmm……太能拉高大家预期了。

不管是有意还是无意，Anthropic都和最近一直炒GPT-5热度的OpenAI形成鲜明对比，谁现在更加技术本色，大家想必也心中有选择。

以及Opus 4.1的System Card也一同发布，其中表明Opus 4.1是对Opus 4的进一步调整，模型的核心尺寸或训练方法都没有变化

同时Anthropic也公布了Opus 4.1的更多相关指标。

比如Opus 4.1的无害回复回应率更高，如果开启推理，指标已经能达到99.06%。

更多内容大家可在System Card中进一步查看。

最后，Claude Opus 4.1已面向所有付费用户开放，包括Claude Code；也可以通过API、Amazon Bedrock和Vertex AI上使用，定价和Claude Opus 4一样。

Blog：https://www.anthropic.com/news/claude-opus-4-1
System Card：https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf

小编推荐

我要评论

发表

取消