凌晨三点被手机震醒,技术群里99+消息轰炸——Anthropic半夜放核弹了!Claude 3.7 Sonnet带着全球首个"混合脑"杀到,编程能力直接把GPT-4o和DeepSeek R1按在地上摩擦。这一重磅发布为AI领域带来了哪些突破性进展?让我们一起来了解。
一、AI进入"双系统"时代:你的代码拍档会开狂暴模式了
当所有厂商都在卷参数时,Claude 3.7祭出王炸组合混合推理模型:日常模式+深度模式双系统自由切换。
-
日常标准模式作为Claude 3.5 Sonnet的升级版,能快速输出答案
-
深度思考模式在回答前进行自我反思,显著提高在数学、物理、指令跟踪、编码等复杂任务中的表现
不同于 OpenAI、DeepSeek 将两种模型独立运行,Claude 3.7 Sonnet 选择了「融合」:既可以像传统模型那样迅速给出回答,又能在复杂问题上调用更深层次的推理能力进行思考,并给出更好的回答。
二、编码能力全面领先
Anthropic特别强调:"Claude 3.7 Sonnet是我们迄今为止最好的编码模型。"早期测试显示,在SWE-bench Verified(一个评估LLM解决GitHub真实软件问题能力的基准测试)中,Claude 3.7 Sonnet不仅超越了前代Claude 3.5 Sonnet,还明显优于OpenAI o1、DeepSeek R1等竞争对手。
三、Claude Code:AI代理编程的新时代
与Claude 3.7 Sonnet一同发布的还有Anthropic首款代理编程工具——Claude Code。这一工具可以:
-
搜索和读取代码
-
编辑文件
-
编写和运行测试
-
提交代码并推送到GitHub
-
使用命令行工具
尽管目前Claude Code仅作为有限的研究预览版提供,但它已成为Anthropic内部团队不可或缺的工具。在一次测试中,它一次性完成了通常需要45分钟以上手动工作的任务,显著减少了开发时间和工作量。
未来几周,Anthropic计划进一步改进Claude Code,包括增强工具调用的可靠性、支持长时间运行的命令、改进应用内渲染,并扩展模型对自身能力的理解。
四、定价策略绝杀:OpenAI连夜改PPT
当所有人都以为要涨价时,Anthropic反手甩出王炸:
-
输入Token:3美元/百万(比GPT-4便宜67%)
-
输出Token:15美元/百万(含"思考过程"消耗)
现在我用它批量生成API文档时,成本比请实习生还低。
总结与展望
Claude 3.7 Sonnet的发布标志着AI向更加智能、灵活的方向迈进。通过将快速回应和深度思考能力融合在同一模型中,Anthropic为用户提供了更加自然、高效的AI体验。
特别是在编程领域,Claude 3.7 Sonnet和Claude Code的组合有望显著提升开发效率,减轻开发者的重复性工作负担。这也预示着AI辅助编程将迎来新的发展阶段。
马斯克说Grok-3要当"最聪明的地球人",但Claude 3.7给我的震撼在于:它不在乎人类定义的聪明,只专注解决实际问题。当AI开始理解"屎山代码也是有机生命体"时,或许我们该重新思考——程序员的核心价值,究竟是写if else,还是定义问题本身?
你是否已经迫不及待想要尝试这款"迄今为止最智能的模型"了?