今天,我们宣布推出 Claude 3.7 Sonnet1,这是我们迄今为止最智能的模型,也是市场上第一个混合推理模型。Claude 3.7 Sonnet 可以产生近乎即时的响应或扩展的、循序渐进的思考,让用户可以看到。API 用户还可以精细控制模型可以思考多长时间。
Claude 3.7 Sonnet 在编码和前端 Web 开发方面显示出特别强大的改进。除了该模型,我们还引入了一个用于代理编码的命令行工具 Claude Code。Claude Code 作为有限的研究预览版提供,使开发人员能够直接从其终端将大量工程任务委派给 Claude
Claude 3.7 Sonnet 现在可用于所有 Claude 计划(包括 Free、Pro、Team 和 Enterprise)以及 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI。扩展思维模式可用于除免费 Claude 层之外的所有表面。
在标准和扩展思维模式下,Claude 3.7 Sonnet 的价格与其前辈相同:每百万输入代币 3 美元,每百万输出代币 15 美元——其中包括思考代币。
Claude 3.7 Sonnet 在 SWE-bench Verified 上实现了最先进的性能,该验证评估了 AI 模型解决实际软件问题的能力。有关脚手架的更多信息,请参阅附录。
Claude 3.7 Sonnet 在 TAU 工作台上实现了最先进的性能,TAU 工作台是一个框架,通过用户和工具交互在复杂的实际任务上测试 AI 代理。有关脚手架的更多信息,请参阅附录。
Claude 3.7 Sonnet 在指令遵循、一般推理、多模态能力和代理编码方面表现出色,扩展思维在数学和科学方面提供了显着的提升。