想象一下,你在装饰房间。你可以选择一套标准的家具,这是快捷且方便的方式,但可能无法完全符合你的个人风格或需求。另一方面,你也可以选择定制家具,选择特定的颜色、材料和设计,以确保每件家具都符合你的喜好和空间要求。
比如,选择一个特制的沙发,你可以决定其尺寸、布料类型、甚至是扶手的样式。你还可以根据房间的主题选择颜色,甚至添加一些独特的装饰,比如刺绣或特别的缝线。
这就是Prompt工程的概念。就像你通过选择不同的设计元素来定制家具一样,Prompt工程涉及对AI的输入进行精细调整,以获得更加贴合需求的结果。通过改变、添加或精确化输入的提示,你可以引导AI产生更符合特定要求或风格的输出,就像为房间挑选和定制合适的家具一样。
很多人对语言大模型的认知和理解局限于智能回答层面,将它定位为取代搜索平台的智能应答机器人。但是随着更多大模型在各个领域应用的逐渐渗入,更多企业业务落地场景也在不断挖掘,人们会逐渐意识到大模型的能力远不止仅仅的问答作用。如果我们想要开始正式深入学习大模型的应用,迈开的第一步就会了解到Prompt提示工程,本系列文章将Prompt提示工程从简入深全面讲解以及实际落地运用,赋能不限于直媒体运营、AIGC文案生成,以及语音视频合成方面的运用。
1.什么是Prompt工程?
在AI语境中,"Prompt"通常指的是向模型提出的一个请求或问题,这个请求或问题的形式和内容会影响模型的输出。例如:在一个文本生成模型中,提示可以是一个问题、一个话题或者是一段描述,模型根据这个提示生成相应的文本。Prompt工程是指人们向生成性人工智能(AI)服务输入提示以生成文本或图像的过程中,对这些提示进行精炼的过程。任何人都可以使用文言一心和DALL-E这样的生成器,通过自然语言来进行操作。这也是AI工程师在使用特定或推荐提示对大型语言模型(LLMs)进行精炼时使用的技术。
例如,如果你在使用文言一心来头脑风暴你的简历的专业概述时,你可能会写下这样的命令:“为市场分析师编写一个样本专业概述。”对于文言一心的回答,你可能会给出像“太正式”或“缩短到不超过100个词”这样的反馈。而Prompt工程就是不断整理优化每一次的提示词,让LLM能够做出最符合我们需要的效果回答。在某些情况下,调整提示可能是提高模型输出质量的唯一途径,特别是在使用那些不允许直接修改内部机制的预训练模型时。
我们再来看看ChatGPT的Prompt工程师给的例子:
For text models like ChatGPT:
- What’s the difference between a professional summary and an executive summary?
- Write a professional summary for a marketing analyst looking for a marketing manager job.
- Now trim it down to less than 60 words.
- Rewrite it with a less formal tone… For image models like DALL-E:
- A painting of a cat.
- A painting of a cat chasing a mouse in Impressionist style.
- Now use only warm tones in the painting.
文本模型ChatGPT和DALL-E例子都差不多,以文本模型ChatGPT为例子,提出的提示词有四句:
第一句为提出问题,专业和执行总结,引出两个具体目标;
第二句指明场景情景和具体服务对象。
第三句对生成内容提出要求。
第四句加入情感内容到生成文本中。
这里我们要知道,因为生成人工智能是一个根据人类和机器产生的数据训练的机器人,它不具备筛选你正在交流的内容以理解你实际在说什么的能力。也就是说你说的就是你得到的。当将查询输入到AI生成器中时,最好使用特定的、简单的语言进行查询,并且没有不必要的填充符。例如,您可以查询“为学术研究提案编写大纲,包括标题、摘要和下一步行动”,而不是“编写包含标题和下一步骤的大纲”。所以构建Prompt工程也有一些技巧和原则,简单可以归结为:
问题式Prompt
问题式Prompt通过提出问题来引导模型生成答案。这类Prompt最直接、最简单,适用于需要获取具体信息的场景。就像第一个例子给出的What’s the difference between a professional summary and an executive summary?
陈述式Prompt
陈述式Prompt通过描述一个场景或状态来引导模型生成相关内容。这类Prompt更注重模型的创造性和表现力,适用于需要模型产生描述、故事或观点等内容的场景。比如为一位正在寻找营销经理工作的营销分析师写一篇专业摘要,Write a professional summary for a marketing analyst looking for a marketing manager job.
指令式Prompt
指令式Prompt通过给出明确的指令来引导模型完成特定任务。这类Prompt要求模型具有较强的执行能力,适用于需要模型进行翻译、纠错、编程等任务的场景。比如现在把它缩减到不到60个单词,Now trim it down to less than 60 words.
情感传入Prompt
在特点的条件下我们可以会需要生成一些带有强烈情感的文本内容,带有主观意识的思想去批判或者是抨击,而如果我们想要生成一些此类内容就需要让语言模型知道我们所处的环境以及主观情感色彩。不提供Prompt情感词,AI回答的永远是中性感情的内容生成。
当然,以上对于Prompt工程来说仅仅是浅显分类,真正要做好针对特点场景的分类还得让Prompt工程师对症下药。参考微软举垂直Prompt复杂度举例,帮助我们更好认识到Prompt工程:
Instruction Type | Prompt | Completion |
---|---|---|
Simple instructions | Write an introduction for a weekly newsletter. | Welcome to our weekly newsletter. This week we have a special focus on productivity. We’ll be sharing tips and tricks on how to be productive in all areas of your life. We hope you enjoy and please share with your friends! |
Complex instructions | Write an introduction for a weekly newsletter to my company named Contoso. It should mention the great all hands meeting we had last week and thank the team for all their hard work over the tough past few months. | Welcome to Contoso’s weekly newsletter! We had a great all hands meeting last week and I want to thank the team for all their hard work over the tough past few months. We’re looking forward to a bright future and I’m confident that with our team’s dedication and commitment, we will achieve great things. Thank you for being a part of our team and I look forward to working with you all in the coming weeks and months. Sincerely, Your name. |
Complex Instructions | Write an introduction for a weekly newsletter, including the following: - My company is named contoso - An exuberant greeting - Thanking the team for their hard work over a couple tough months - Positive outlook for the coming quarter - Signed by the SLT | Hello Contoso team! I wanted to take a moment to thank you for all your hard work over the past few months. It’s been a tough couple of months, but you’ve all pulled together and done an amazing job. I’m really proud of you all. Looking ahead to the next quarter, I’m feeling really positive. I think we’re going to achieve some great things. Thanks again, The Senior Leadership Team. |
2.Prompt工程师主要做什么?
Prompt工程师的主要工作是设计、优化和精炼用于生成性人工智能系统的提示(prompts)。这些提示是指导AI系统生成特定输出的文本输入,例如文本、图像或代码。Prompt工程师的角色在不同的AI应用领域中可能有所不同,主要是根据对于的业务场景来构建特征提示词。Prompt工程师对于人工智能工程师创造更好的服务很重要,比如处理客户服务任务或生成合法合同的聊天机器人。确保像文言一心这样的生成性人工智能服务能够提供输出,需要工程师构建代码,并根据广泛准确的数据对人工智能进行培训。
在数据驱动的大世界里,我们已经到了一个地步,训练人工智能模型可以帮助更高效地提供解决方案,而无需手动对大量数据进行排序。适当的Prompt工程师还可以识别和减轻注入攻击(恶意入侵ChatGPT或聊天机器人背后的逻辑),以确保公司提供一致和准确的服务。Coursera对Prompt工程师的要求有:
Prompt engineers need to be skilled in the fundamentals of natural language processing(NLP), including libraries and frameworks, Python programming language, generative AI models, and contribute to open-source projects.
Prompt工程师需要熟练掌握自然语言处理(NLP)的基础知识,包括库和框架、Python编程语言、生成人工智能模型,并为开源项目做出贡献。成功的提示往往依赖于“一次性”或“少量”学习的实践。这是指通常通过包括输入和输出对来包括模型的期望行为的一个或多个示例。这不是在模型被永久改变的意义上的学习,而是在示例更好地调节模型,使其仅对当前推理做出所需的响应。使用没有示例的提示有时被称为“零样本”学习。使用Chat Completion API,通常会在初始系统消息之后以示例用户/助手交互的形式向消息阵列中添加少量的热学习示例:
Learning Type | Prompt | Completion |
---|---|---|
Zero-shot | Headline: Coach confident injury won’t derail Warriors Topic: | The coach is confident that the injury won’t derail the Warriors’ season. The team is still focused on their goals and that they will continue to work hard to achieve them. |
Few-shot | Headline: Twins’ Correa to use opt-out, test free agency Topic: Baseball Headline: Qatar World Cup to have zones for sobering up Topic: Soccer Headline: Yates: Fantasy football intel for Week 6 Topic: Football Headline: Coach confident injury won’t derail Warriors Topic: | Basketball |
Prompt工程师一般会根据其目的和设计方式将Prompt分为几个主要类别:
零样本(Zero-shot)Prompting:
- 在这种情况下,prompt被设计成直接询问模型一个问题或请求,而不提供任何特定的训练例子。
- 这种方法依赖于模型已经通过预训练获得的知识。 单样本(One-shot)或少样本(Few-shot)Prompting:
- 这种方法在prompt中包含一个或几个示例,以指导模型如何响应。
- 这些例子充当了模型应该如何处理类似情况的示范。 链式(Chain-of-thought)Prompting:
- 在这种方法中,prompt被设计为引导模型展示其思考过程,尤其是在解决复杂问题时。
- 这有助于提高模型输出的透明度和可解释性。
模板式(Template-based)Prompting:
- 在这种情况下,prompt是根据特定的模板或结构来设计的,这些模板旨在有效地激发模型的正确响应。
- 这种方法通常用于具体的应用场景,如文本分类或实体识别。
对话式(Conversational)Prompting:
- 这种prompt设计为对话形式,模拟自然语言对话场景,以引导模型在对话环境中产生响应。
- 这种方式适用于聊天机器人和交互式应用。
任务特定(Task-specific)Prompting:
- 这类prompt专门为特定的任务或应用场景量身定制,如翻译、摘要、问题回答等。
- 这种方法强调根据任务需求来优化prompt的设计。
这里仅展开一个具体Prompting给大家演示,并不展开所有形式,后续文章将会详细讲解,以模板式(Template-based)Prompting为例:
任务:对给定的文本段落进行情感分析,判断它是正面的、负面的还是中性的。
模板式Prompt:
- “文本:待分类的文本段落
- 情感分析结果:这段文本的情绪是正面/负面/中性。” 在这个例子中,模板由两部分组成:
- “文本:”后跟随待分类的文本段落。
- “情感分析结果:”引导模型基于所提供的文本作出情感分类。
使用模板式Prompt的一个具体例子可能是:
- “文本:我今天过得非常愉快,天气晴朗,和朋友们度过了美好的一天。
- 情感分析结果:这段文本的情绪是正面/负面/中性。”
本章内容已经足够多了,下篇文章将展开Prompt在不同场景下的构建和使用。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
😝有需要的小伙伴,可以Vx扫描下方二维码免费领取==🆓