Claude 3.7 Sonnet 既是普通的 LLM 模型,又是推理模型:您可以选择何时让模型正常回答,何时让模型在回答前思考更长时间。在标准模式下,Claude 3.7 Sonnet 是 Claude 3.5 Sonnet 的升级版。在扩展思维模式下,它会在回答前进行自我反思,从而提高其在数学、物理、遵循指令、编码和许多其他任务上的表现。我们通常发现,在两种模式下,对模型的提示方式类似。Claude 在编码能力方面全面领先:Cursor 指出,Claude 在实际编码任务中再次名列前茅,在处理复杂代码库和高级工具使用等领域都有显著改进。Cognition 发现,在规划代码更改和处理全栈更新方面,Claude 远胜于任何其他模型。Vercel 强调了 Claude 在复杂代理工作流程中的卓越精确度,而 Replit 已成功部署 Claude 从头开始构建复杂的 Web 应用程序和仪表板,而其他模型则停滞不前。在 Canva 的评估中,Claude 始终如一地生成可用于生产的代码,具有卓越的设计品味,并大大减少了错误。