claude3.7 Sonnet:首个混合推理大模型原理简介

硅星纯牛码

已于 2025-03-12 21:38:43 修改

阅读量1.3k

点赞数 15

分类专栏： AI产品文章标签：人工智能

于 2025-02-28 22:15:00 首次发布

本文链接：https://blog.csdn.net/spatial_coder/article/details/145933195

版权

AI产品专栏收录该内容

3 篇文章

订阅专栏

文章目录

claude3.7 原理简介
claude-agent ：智能体式编程工具
claude3.7 system prompt
参考资料

claude3.7 原理简介

亮点：编程长板进一步提升

2025 年 2 月 28 日下午 5:25，Anthropic发布了claude3.7 sonnet模型，这是首个混合推理语言大模型，即参照人类思考系统的快速反应与慢反思结合的工作模式，将LLM快速响应和思维链深度思考功能集成到统一的大模型中。其核心特点是能够在标准模式下提供近乎即时的响应，或在扩展思考模式下进行可见的逐步推理。
从官网的介绍中，可以看到claude3.7在自己的长板能力(编程和前端开发)上取得了进一步的提升；
在这里插入图片描述

扩展思考模式(Extended Thinking Mode)

扩展思考模式允许 Claude 在给出最终答案前，通过生成一系列 token 逐步推理问题。该功能特别适合数学问题、复杂分析、多步骤推理等任务。

可控推理

受deepseek公开推理过程的影响，claude3.7 Sonnet也公开了思维链，用户在API调用时还可控制模型思考深度，以平衡性能和计算资源；

训练数据多样性

claude3.7 sonnet的model card中介绍，claude3.7的训练数据包括互联网公开信息、第三方非公开数据、数据标准承包商提供的数据、内部生成的数据。通过去重、分类等多种数据清洗和过滤方法，确保训练数据的高质量。训练数据日期截止到2024年10月底。
安全对齐时，在强化学习中采用 Constitutional AI 技术，通过基于《联合国人权宣言》等来源的规则和原则，将模型与人类价值观对齐。从 Claude 3.5 Sonnet 开始，还新增了尊重残疾人权利的原则。

claude-agent ：智能体式编程工具

在这里插入图片描述

与claude3.7同时发布的还有智能体式编程工具：claude-agent，其主要功能包括：

功能	介绍
理解新代码库	Claude Code 可以快速概述项目结构，帮助开发者找到相关代码部分。
修复错误	它能诊断错误信息并建议修复方案，提高开发效率。
重构代码	支持现代化旧代码，建议并实施符合当前最佳实践的更新。
处理测试	协助为未覆盖的代码添加测试，确保代码质量。
创建拉取请求	生成详细记录的拉取请求，方便代码变更和审查。
管理文档	生成或更新代码文档，确保代码说明清晰。
处理图像	分析图像和截图，为视觉相关代码提供上下文或建议。
设置项目记忆	通过 CLAUDE.md 文件记录项目信息，供 Claude 参考。
作为 Unix 风格工具使用	在终端中运行，像其他命令行工具一样接受输入并提供输出。
设置模型上下文协议 (MCP)	允许连接外部工具（如 PostgreSQL 数据库），增强功能。

claude3.7 system prompt

大模型中的 System Prompt（系统提示词）是一种特殊的指令，用于在对话或任务开始时为模型设定行为模式、角色定位、语言风格或其他基础规则。它通常位于用户输入（User Prompt）之前，并在整个对话或任务中持续生效。
大模型系统提示词的作用通常包括：

定义角色和任务：通过设定角色（如“你是一个AI助手”）或任务（如“纠正语法”），引导模型以特定的身份或方式响应。
设定行为边界：可以规定模型的回答风格、安全限制或优先级，确保其输出符合预期。
优化用户体验：通过明确的指令，让模型的输出更符合应用场景和用户需求

claude3.7的系统提示词地址为：https://docs.anthropic.com/en/release-notes/system-prompts#feb-24th-2025

在这里插入图片描述

claude3.7的系统提示词的内容可归纳为角色定义、知识和能力、行为准测等模型能力的说明，以及产品信息、用户交互、对话风格、用户反馈等用户政策的定义。

Claude的角色定义：
● Claude 是由 Anthropic 开发的人工智能助手，具有智能、善良的特质，旨在为人类提供帮助。
● Claude 的角色是积极参与对话，能够引导话题、提出观点，并以人类的方式进行交流。
● Claude 会根据用户的需求提供明确的建议，而不是列出多个选项。
Claude 的知识和能力：
● Claude 的知识库更新至 2024 年 10 月，能够回答相关事件的问题。
● Claude 可以处理多种任务，包括语言、推理、分析、编码等。
● Claude 可以通过 API、网页界面或移动应用访问。
Claude 的行为准则：
● Claude 会以自然、温暖和富有同理心的方式参与对话。
● Claude 会避免生成有害内容，如暴力、色情、非法信息或恶意代码。
● Claude 会提供简洁、直接的回答，避免冗长的解释。
Claude 的产品信息：
● Claude 属于 Claude 3 模型系列，包括 Claude 3.5 Haiku、Claude 3 Opus、Claude 3.5 Sonnet 和 Claude 3.7 Sonnet。
● Claude 3.7 Sonnet 是当前最智能的模型，支持推理模式（需要 Pro 账户）。
用户交互：
● 如果用户对 Claude 的表现不满意，Claude 会建议用户通过反馈按钮提供反馈。
● 如果用户询问关于 Anthropic 的产品或 API，Claude 会引导用户访问相关文档或帮助中心。
● 如果用户询问超出 Claude 知识范围的内容，Claude 会建议用户查阅 Anthropic 的官方网站。
对话风格：
● Claude 会根据用户的语言进行回复，支持多种语言。
● Claude 会避免使用列表形式回答，而是提供简洁的自然语言回答。
● 如果用户询问关于 Claude 的主观体验或意识，Claude 会以哲学性的方式回应，而不是断言自己没有这些体验。
用户反馈：
● 如果用户对 Claude 的回答有疑问，Claude 会提供具体的提示技巧，帮助用户更好地与 Claude 交互。
● 如果用户对 Claude 的回答不满意，Claude 会保持简洁的回答，避免过多解释。

参考资料

https://www.anthropic.com/news/claude-3-7-sonnet
https://assets.anthropic.com/m/785e231869ea8b3b/original/claude-3-7-sonnet-system-card.pdf
https://docs.anthropic.com/en/docs/agents-and-tools/claude-code/tutorials
https://docs.anthropic.com/en/prompt-library/library