大型语言模型 (LLM) 作为近年来人工智能领域的明星技术,以其强大的文本生成、翻译、问答等能力,吸引了广泛的关注。然而,LLM 并非魔法,其能力的发挥很大程度上取决于我们如何与之“沟通”,即如何编写有效的 Prompt。
想象一下,LLM 就像一位技艺精湛的画家,而 Prompt 则是你提供的画布和颜料,以及对作品的期望描述。Prompt 的质量直接影响着最终作品的风格和效果。因此,优化 Prompt 是充分发挥 LLM 潜力的关键所在。
1. 打好基础:清晰、完整地描述任务
与人类不同,LLM 无法进行推理和询问,因此 Prompt 中需要包含所有必要信息。清晰地描述任务目标,例如,你是希望 LLM 生成一篇新闻报道、一首诗歌,还是一段代码?同时,明确期望的输出格式,例如文本长度、风格、语气等。此外,如果任务涉及特定领域或背景知识,也需要在 Prompt 中进行说明。
例如:
-
模糊指令: 写一篇关于人工智能的文章。
-
清晰指令: 写一篇 800 字左右的科普文章,介绍人工智能的发展历史、主要技术和应用领域,面向中学生读者,语言风格通俗易懂。
补充说明:除了以上基本信息,还可以考虑以下方面:
-
目标受众: 明确目标受众是谁,例如专业人士、普通大众、儿童等,有助于 LLM 调整语言风格和内容深度。
-
示例输出: 提供一些符合期望的输出样例,可以帮助 LLM 更好地理解任务要求。
2. 细节决定成败:格式、语气与一致性
LLM 对 Prompt 的细节非常敏感,包括格式、语气和顺序等因素。保持 Prompt 格式的一致性,例如使用相同的标点符号、缩进和换行方式,有助于 LLM 更好地理解任务。使用专业、客观的语气,避免使用歧义或模棱两可的表达,以免误导 LLM。
-
提示词选择:不同的提示词可以引导 LLM 生成不同风格的内容。例如,使用“总结”、“分析”、“评价”等提示词,可以引导 LLM 生成更客观、理性的内容;使用“描述”、“想象”、“创造”等提示词,可以引导 LLM 生成更生动、富有创意的内容。
-
一致性原则:确保 Prompt 中的所有信息都与任务目标和期望输出保持一致,避免出现矛盾或冲突的信息。
3. 赋予灵魂:角色扮演与场景设定
LLM 就像一位多才多艺的演员,可以扮演各种角色。通过要求 LLM 扮演某个角色,例如“专家”、“学者”或“作家”,可以唤起 LLM 相关的知识和语言模式,生成更符合预期的输出。
例如:
-
要求 LLM “扮演一位经验丰富的旅行家,介绍你最喜欢的旅游目的地”,可以生成生动、详细的游记。
-
要求 LLM “扮演一位历史学家,分析第一次世界大战的起因和影响”,可以生成一篇严谨的历史论文。
-
角色深度:为了使 LLM 更好地扮演角色,可以提供更详细的角色描述,例如角色的背景、性格、专业知识等。
-
场景构建:除了角色扮演,还可以构建特定的场景,例如“你正在参加一场辩论赛”或“你正在接受记者采访”,以引导 LLM 生成更符合场景需求的内容。
4. 引导思维:CoT 思维链与内嵌工作流程
CoT (Chain of Thought) 思维链是一种引导 LLM 进行逐步推理的方法。通过在 Prompt 中加入“让我们一步一步思考”等提示,可以帮助 LLM 将复杂任务分解成更小的步骤,提高推理的准确性和逻辑性。例如,要求 LLM 解决一道数学题,可以先让它列出解题步骤,然后再计算答案。
内嵌工作流程是指在 Prompt 中描述解决问题的具体步骤,例如先收集信息,然后进行分析,最后得出结论。这种方法可以帮助 LLM 更好地理解任务并执行指令。
-
步骤分解:将任务分解成更小的步骤时,要确保每个步骤都是明确、可执行的,并且步骤之间具有逻辑顺序。
-
中间输出:可以要求 LLM 在每个步骤结束后输出中间结果,以便检查推理过程是否正确。
5. 示范的力量:Few-shot 学习与样例选择
Few-shot 学习是指通过提供少量样例来引导 LLM 学习特定模式。选择合适的样例至关重要,应确保样例与任务目标和输出格式保持一致,涵盖不同的输入和输出情况,并确保其准确性和相关性。
例如,如果希望 LLM 生成电影评论,可以提供几篇优秀的影评作为样例,帮助 LLM 理解评论的结构、语言风格和评价标准。
-
多样性原则:样例应尽可能多样化,涵盖不同的主题、风格和观点,以提高 LLM 的泛化能力。
-
质量控制:确保样例的质量,避免使用包含错误信息、歧义或不相关内容的样例。
6. 扩展能力:利用外部工具
LLM 并非万能,某些任务可能需要借助外部工具来完成,例如数值计算、信息检索或代码执行。通过与外部工具结合,可以扩展 LLM 的能力范围,使其能够处理更复杂的任务。例如,可以使用计算器帮助 LLM 进行数学运算,或使用搜索引擎帮助 LLM 获取最新信息。
-
工具选择:选择合适的工具取决于任务需求,例如需要进行数值计算,可以选择计算器;需要检索信息,可以选择搜索引擎或数据库。
-
API 集成:许多外部工具都提供 API 接口,可以将 LLM 与这些工具进行集成,实现更复杂的应用场景。
7. 化繁为简:问题分解与子任务处理
将复杂问题分解成多个子问题,可以帮助 LLM 更好地理解和解决问题。根据问题的结构、类型和难度,选择合适的分解方法,并确保子问题之间相互独立且可解。例如,如果希望 LLM 写一篇关于气候变化的文章,可以先让它分别介绍气候变化的起因、影响和解决方案,然后再将这些内容整合起来。
-
问题分析:仔细分析问题,确定问题的核心要素和子任务。
-
任务分配:将子任务分配给 LLM 或其他工具,并确保每个任务都有明确的输入和输出。
-
结果整合:将子任务的输出进行整合,形成最终的解决方案。
Prompt 优化是通往 AI 语言艺术世界的钥匙,它需要我们深入理解 LLM 的工作原理,并掌握有效的 Prompt 编写技巧。通过不断探索和实践,我们可以解锁 LLM 的无限潜力,使其成为更强大的工具,为我们的生活和工作带来更多便利和惊喜。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。