超越DeepSeek，Claude 3.7来了！T0级编码能力+首个混合推理模型

最新推荐文章于 2025-06-30 16:41:12 发布

运营黑客

最新推荐文章于 2025-06-30 16:41:12 发布

阅读量884

点赞数 5

CC 4.0 BY-SA版权

文章标签：人工智能 AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Zhangh2013/article/details/145850941

今年，在 DeepSeek 这条鲶鱼的刺激下，大模型领域，又卷起来了！

前脚马斯克刚推出 Grok 3。

今天凌晨，Anthropic 就放出新一代大模型：Claude 3.7 Sonnet。

在延续了 Claude 3.5 优秀的内容生成、卡片创作、编码能力基础上，Claude 3.7 Sonnet 新增两大核心看点：

⭕️ 全球首个推出”混合推理模型“；

⭕️ 推出重磅级编码工具——Claude Code

接下来，我们一个一个拆开来看。

01 Claude 3.7 Sonnet

Claude 3.7 Sonnet 不出意外地将”推理模型“融合进来，成为继 OpenAI 的 GPT-o1，以及 DeepSeek-R1之后，又一款拥有强推理能力的 AI 大模型。

并且，Anthropic 还开创性地推出一个新的模型模式——“混合推理模型”。

我们可以把它理解成，在对话中可以无缝切换 DeepSeek v3 和 R1 两种模型的一种模式。

Anthropic 将这两种模式定义为：

Normal（标准模式）
Extended（扩展/推理模式）

用户可以自由切换这两种模式。

Normal（标准模式），我们可以把它看成将 Claude 3.5 能力全面加强的一个进阶版。

Extended（扩展/推理模式），则是类似 DeepSeek-R1 的强推理版本，不仅引入了详细的逐步推理，而且公开了「思考」过程。在数学、物理、指导跟踪、编码等任务上表现出色。

在 SWE-bench（真实软件问题解决）和 TAU-bench（复杂任务交互）测试中，Claude 3.7 Sonnet 更是刷新纪录。

此外，在 Anthropic 内部，Claude 3.7 Sonnet 还做了一项非常有趣的测试：

他们给了Claude 配备了基本的内存、屏幕像素输入和按键操作功能，让Claude开着扩展思维去玩 Pokémon（宝可梦）。

Claude 3.7 展现了强大的决策与规划能力。

目前，Claude 3.7 Sonnet 模型现已适用于所有 Claude 订阅计划，包括：

√ 免费版
√ 专业版
√ 团队版√ 企业版

同时也可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的Vertex AI 访问。

02 Claude Code

Anthropic 还推出了一款智能编程工具——Claude Code，目前仅作为研究预览版限量开放。

你可以把它看成 ChatGPT 代码解释器的进阶版本，或者类似于 Cursor 的 AI 编程工具。

它可以在终端直接操作，搜索/阅读代码、编辑文件、编写和运行测试、提交代码到 GitHub，所有开发流程在终端不用 Linux 命令也能全部搞定。

我们来看下它的几个使用示例：

① 解释项目结构

② 编写测试

③ 构建应用

据 Anthropic 官方介绍：在早期测试中，Claude Code 能一次性完成通常需要 45 分钟以上的人工任务，特别是在测试驱动开发（TDD）、调试复杂问题和大规模重构方面表现突出。

它的核心功能包括：

√ 编辑文件
√ 修复 Bug
√ 回答关于代码架构和逻辑的问题
√ 执行测试
√ 修复测试错误
√ 进行代码格式检查
√ 搜索 Git 历史记录
√ 解决合并冲突
√ 创建提交和拉取请求
……

Anthropic 表示，在接下来的几周内，他们计划持续优化 Claude Code，重点改进包括提升工具调用的稳定性、支持长时间运行的命令、改进应用内的渲染效果，以及增强 Claude 对自身能力的理解。

这次发布预览研究版本也是希望深入了解开发者如何使用 Claude 进行编程，从而为进一步优化未来的模型版本提供参考。

OK，今天的分享就到这里。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。