标签:大语言模型选择, 模型比较, 模型能力, 模型行为差异, 思考型模型, 控制型模型, Cursor模型指南, 交互风格, AI辅助开发, LLM模型推荐
今天 eric zakariasson早上的博文给了我们答案和指导。
在 Cursor 中,选择正确的模型意味着你能更快完成任务、减少资源浪费,并获得更优结果。Cursor 支持所有主流顶级模型,点击这里查看模型清单。
虽然大多数模型都能完成相似任务,但它们的行为风格截然不同,这种差异很重要。
模型的差异
每个模型的训练方式不同,响应风格也不同。有些模型“深思熟虑再动笔”,而有些则“快写为先”。有的模型很主动,迅速给出答案;有的则会先确保理解你的意图再行动。
下面是几个重要维度:
- 果断性(Assertiveness):如
gemini-2.5-pro
、claude-3.7-sonnet
,这些模型决策迅速、主动性强。 - 好奇心(Curiosity):如
o3
、claude-3.5-sonnet
,这些模型会提出问题、认真理解上下文再行动。 - 上下文窗口大小:一些模型能一次性处理更大的代码量,非常适合大型项目中的全局分析。
为什么选择模型如此重要
每个模型都有自己擅长的方向。有些适合快速实现,有些更适合方案规划或问题探索。选择合适模型能帮助你:
- 获得更快的输出
- 获得更高质量的建议
就像与不同风格的开发者合作一样,每个模型也有自己的“阅读习惯、思考路径和行为偏好”。熟悉这些模型,就能直觉判断哪一个适合当前任务。
模型行为分类
可以通过“模型的主动性”来理解它们的行为差异。
1. 思考型模型(Thinking Models)
这类模型会主动推断你的意图、预先规划,并自主做出决策。
- 适合你希望模型“自己跑起来”的场景
- 不需要太多提示,模型自己会给出想法
- 有时会超出你预期地大幅修改
代表模型:
claude-3.7-sonnet
gemini-2.5-pro
o3
(擅长复杂推理)
适用于:探索创意、大范围重构、需要模型自己出方案的场景。
2. 非思考型模型(Non-thinking Models)
这类模型不会擅自猜测意图,执行完全依赖你的明确指令。
- 适合需要你精确控制输出的场景
- 提示要更明确,但行为更可预测
- 更容易做微调和修正
代表模型:
claude-3.5-sonnet
gpt-4.1
适用于:严格修改、精准控制、标准化流程类任务。
3. 按风格选择
很多用户根据“互动风格”而不是“任务类型”来挑选模型。有些人偏爱主动型模型,有些人更喜欢听话型。
以下几款模型可作为稳定的日常主力(Daily Driver)使用:
claude-3.5-sonnet
claude-3.7-sonnet
gemini-2.5-pro
gpt-4.1
选择取决于你希望控制多少输出。
如何选择模型
Cursor 提供一组精心挑选的高性能模型,你可以根据以下因素做出选择:
1. 你的提示风格
如果你更喜欢… | 推荐风格模型 |
---|---|
自己控制节奏,明确给出每一步指令 | gpt-4.1 、claude-3.5-sonnet |
让模型自主行动,主动帮你规划 | gemini-2.5-pro 、claude-3.7-sonnet 、o3 |
2. 任务类型推荐
任务类型 | 推荐模型 |
---|---|
小规模改动、小功能开发 | claude-3.5-sonnet , gpt-4.1 |
大型重构、系统优化 | claude-3.7-sonnet , gemini-2.5-pro |
搜索代码或理解复杂依赖 | claude-3.7-sonnet , o3 |
需求规划、方案生成、思维导图 | gemini-2.5-pro , o3 |
调试复杂错误或深层逻辑推理 | o3 (推理最强,但略慢) |
📌 o3
专为高复杂度问题设计,适合偶尔使用,不建议作为默认模型。
自动选择(Auto-select)
Auto 模式会从高性能模型池中自动选出稳定可靠的模型(不包含 o3
)。它不会根据任务类型动态切换,但能提供平衡、稳定的默认体验,适合不知道选谁时使用。
自定义模式(Custom Modes)
你可以将成功的组合保存为“自定义模式”:
- 预选模型
- 设置自定义提示词或指令
- 快速复用已验证的工作流配置
这样可以减少重复劳动,提高效率。
总结
- 选择最适合你的模型,不要迷信“唯一最佳”
- 有的模型更主动,适合探索、规划、出方案
- 有的模型更听话,适合精准控制和规范任务
claude-3.5-sonnet
、claude-3.7-sonnet
、gemini-2.5-pro
、gpt-4.1
都适合作为主力模型o3
是最强大脑,适合最难搞的场景- 不确定就用 Auto-select
- 用 自定义模式 固定你喜欢的搭配,提高效率!
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。