Anthropic发布Claude Opus 4.8:编程能力再突破,价格反而更便宜

AI资讯1小时前发布 EdgeClaw
33 00

Anthropic于5月28日正式发布Claude Opus 4.8旗舰大模型,这是继Opus 4.7发布仅41天后的又一次重大迭代。新模型在软件工程基准测试SWE-bench Verified上取得88.6%的成绩,在12项以上基准测试中超越GPT-5.5,展现出强大的编程能力。

与以往追求”越强大越好”的思路不同,Opus 4.8最受关注的特性是约4倍更少概率忽略自身代码缺陷。当模型对某个问题不够确定时,它会主动表达”不确定”,而不是像之前的大模型那样”一本正经地胡说八道”。Anthropic表示,这一改进大幅提升了模型的诚实度和可靠性。

Claude Code同步迎来重磅更新,新增动态工作流功能。该功能可自动规划并执行数百个并行子智能体处理大规模代码迁移任务,让复杂的代码库改造从”不可能完成的任务”变成”一键搞定”。

最令人惊喜的是价格策略:Opus 4.8的价格保持不变,同时Fast Mode速度提升2.5倍、成本降低3倍。这意味着开发者可以用更低的价格获得更强的性能,AI编程的门槛进一步降低。

Claude Opus 4.8神经网络芯片在深蓝色数据流中闪烁,象征AI模型的前沿算力

从实际测试来看,用Opus 4.8写一个自动整理Excel表格的程序,从需求描述到完整代码只需不到10分钟。同样的任务,传统方式可能需要专业程序员花费一整天。

Anthropic还宣布,Claude Code支持中文对话,开发者可以直接用中文描述需求,模型会返回完整可运行的代码。这种”中文友好”的特性,让编程小白也能快速上手AI辅助开发。

程序员在暗色代码编辑器前工作,周围环绕着光点连线的未来科技感氛围

业内分析认为,Claude Opus 4.8的发布标志着AI编程从”辅助工具”向”主力开发”的角色转变。随着模型能力的提升和成本的下降,AI编程正在成为软件行业的标配技能。

值得注意的是,Opus 4.8在Terminal-Bench 2.1上以74.6%的成绩惜败于GPT-5.5的78.2%,说明在某些垂直场景下,OpenAI仍具优势。但综合性价比考量,Anthropic的策略显然更讨开发者欢心。

芯片纹路与精密电路交织的数字世界,展现人工智能技术的精密与复杂

对于国内开发者而言,Claude Opus 4.8的发布也带来了新的思考:当AI编程能力越来越强,程序员的核心竞争力将从”写代码”转向”提需求”——如何清晰地描述问题、有效地验证结果,正在成为新的硬通货。

© 版权声明

相关文章