Andrej Karpathy 无需介绍,目前可以说是整个地球上的最权威大模型布道者,我只是其一个小小的拥趸。最近大神又出了一个“我是任何使用 LLMs”视频,相信很多大模型爱好者都看过了。本文将视频中Karpathy 所使用的工具网站和提到的技能点进行整理。
从 OpenAI 出来后,Karpathy专心搞 AI+教育,所以视频中提到的内容含金量非常高,强烈建议收藏。
1、在线 Token 计算器 titokenizer.vercel.app
这个网站可以在线计算你的提示词使用了多少 Token 数量,并且可以选择各个模型,比如 DeepSeek-R1 也可以选择。
2、在线“黑板” excalidraw.com
excalidraw是一个开源在线手绘白板项目,所有数据都保存在本地,提供了各种“画笔”工具,方便网络上互相传递想法💡
3、记得点击“开启新对话”(也算一个工具使用的“点”吧)
不论任何 LLM 网站,当你想要进行新的话题,或者输入新的提示词时,如果和当前对话没有关系,记得点击“开启新对话”来刷新。否则对话会变得很慢,并且和之前话题没有关系,也会让大模型感到“迷惑”。
4、注意大模型的价格层级和对应的模型版本
比如 OpenAI 如果购买Plus 版本后,可以选择的模型如下图所示。
比如 DeepSeek 可以通过“深度思考(R1)”按钮来切换使用 DeepSeek-V3 或者 DeepSeek-R1.
5、决定何时选择“思考模式”和“联网搜索”
如果不选择这两个工具,大模型在对上下文窗口进行“预测”时是没有最新的、最近的一些的知识点,当你的问题或者提示词涉及到新的知识点,需要调用联网搜索。
6、注意数学计算调用Python 解释器
大模型对于数学计算,如果不调用类似 Python 解释器的话,还是会存在严重的“幻觉”,比如当计算大数乘法时,ChatGPT 直接调用了 Python 解释器,用程序计算,实际过程已经不是大模型在求解。
DeepSeek 的话,可以看到我使用 V3 模型,计算方式有点过于“有趣”了,看起来似乎没有集成类似 Python 解释器,但是计算结果是正确的。但是如果你让 DeepSeek 再计算更大数字的乘法时,模型就会给出错误的“答案”。
所以当用大模型进行精确计算时,要小心,模型是依靠程序计算,还是靠着幻觉在输出。
7、claudeartifacts 收集 claudeartifacts.com
artifacts 是 Claude的一个特色功能,不论是生成的网站、Web 游戏还是答题卡等,都可以分享出来在线浏览。这个网站收集了众多各地网友分享的 Claude 例子。
8、编程推荐 Cursor,国内平替有字节的 Trae
国内的话,字节推出了国内版的 Trae,可以下载使用。国外版的 Trae 可以使用 claude,两个版本都有 DeepSeek-V3 可用。
9、不仅仅只有文本,还可以语音和图片
通常我们都是通过文本和大模型进行交互,但是现在 ChatGPT、豆包等都提供了语音模式,微软的 Copilot 也同样可以语音。
除了语音外,你也可以直接上传图片,进行 OCR 识别,或者使用大模型进行图片生成。
10、Brave 浏览器
另外值得一提的是,Karpathy 使用的是 Brave 浏览器,而不是 Chrome。如果你对隐私,包括搜索信息的很在意,可以尝试 Brave 浏览器。
当然现在大模型的发展已经到了新的阶段,各种工具和网站每天都会冒出来,不过掌握以上这些基本的,总归是万变不离其宗。
那么,如何系统的去学习大模型LLM?
作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。
所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。
由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
👉大模型学习指南+路线汇总👈
我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
👉①.基础篇👈
基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
👉②.进阶篇👈
接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
👉③.实战篇👈
实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
👉④.福利篇👈
最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!