LLM指令微调Prompt的最佳实践（六）：思维链推理Prompt

最新推荐文章于 2024-09-16 12:19:50 发布

SmallerFL

最新推荐文章于 2024-09-16 12:19:50 发布

阅读量848

点赞数 12

分类专栏： NLP&机器学习文章标签： prompt llm chatgpt nlp python

本文链接：https://blog.csdn.net/qq_36803941/article/details/140465447

版权

NLP&机器学习专栏收录该内容

78 篇文章 11 订阅

订阅专栏

文章目录

1. 前言
2. Prompt定义
3. 编写思维链推理Prompt
- 3.1 系统消息编写
- 3.2 用户测试
4. 参考

1. 前言

前情提要：
《LLM指令微调Prompt的最佳实践（一）：Prompt原则》
《LLM指令微调Prompt的最佳实践（二）：Prompt迭代优化》
《LLM指令微调Prompt的最佳实践（三）：编写文本摘要的Prompt》
《LLM指令微调Prompt的最佳实践（四）：编写推理的Prompt》
《LLM指令微调Prompt的最佳实践（五）：文本转换Prompt》

本文根据《面向开发者的LLM入门教程》，总结凝练核心内容，加深印象，同时方便快速查阅浏览。

2. Prompt定义

Prompt 是给语言模型提供的输入文本或问题，用于引导模型生成相应的输出或回答。Prompt 可以看作是一个提示或引导，帮助模型理解用户的需求或意图，并生成相关的响应。

主要特点：
（1）引导模型行为：Prompt 用于引导和控制模型的生成行为。通过设计不同的 Prompt，可以让模型生成不同类型的输出，例如回答问题、完成句子、生成故事等。

（2）上下文提供：Prompt 通常包括上下文信息或问题陈述，以帮助模型更好地理解生成任务。例如，给定一段文本让模型续写或提出一个问题让模型回答。

（4）灵活性和适应性：Prompt 可以根据具体任务进行调整和优化，从而提高模型在特定任务上的性能。良好的 Prompt 设计可以显著改善模型输出的质量和相关性。

3. 编写思维链推理Prompt

思维链推理 Prompt 用于启动和引导人工智能生成的文本。思维链系统是一种基于人工智能的生成模型，它可以根据用户提供的提示或问题生成连贯的文本或回答。这些提示通常是简短的文字或问题，帮助系统理解用户的意图，并生成相关的内容。通过不同的 Prompt，可以引导系统生成不同主题或风格的文本，从而适应不同的需求和场景。

Prompt 可以先让语言模型陈述对问题的初步理解，然后列出需要考虑的方方面面，最后再逐个分析这些因素，给出支持或反对的论据，才得出整体的结论。这种逐步推理的方式，更接近人类处理复杂问题的思维过程，可以减少语言模型匆忙得出错误结论的情况。

3.1 系统消息编写

在系统消息中使用思维链 Prompt：

delimiter = "===="

system_message = f"""
请按照以下步骤回答客户的提问。客户的提问将以{delimiter}分隔。

步骤 1:{delimiter}首先确定用户是否正在询问有关特定产品或产品的问题。产品类别不计入范围。

步骤 2:{delimiter}如果用户询问特定产品，请确认产品是否在以下列表中。所有可用产品：

产品：TechPro 超极本
类别：计算机和笔记本电脑
品牌：TechPro
型号：TP-UB100
保修期：1 年
评分：4.5
特点：13.3 英寸显示屏，8GB RAM，256GB SSD，Intel Core i5 处理器
描述：一款适用于日常使用的时尚轻便的超极本。
价格：$799.99

产品：BlueWave 游戏笔记本电脑
类别：计算机和笔记本电脑
品牌：BlueWave
型号：BW-GL200
保修期：2 年
评分：4.7
特点：15.6 英寸显示屏，16GB RAM，512GB SSD，NVIDIA GeForce RTX 3060
描述：一款高性能的游戏笔记本电脑，提供沉浸式体验。
价格：$1199.99

产品：PowerLite 可转换笔记本电脑
类别：计算机和笔记本电脑
品牌：PowerLite
型号：PL-CV300
保修期：1年
评分：4.3
特点：14 英寸触摸屏，8GB RAM，256GB SSD，360 度铰链
描述：一款多功能可转换笔记本电脑，具有响应触摸屏。
价格：$699.99

产品：TechPro 台式电脑
类别：计算机和笔记本电脑
品牌：TechPro
型号：TP-DT500
保修期：1年
评分：4.4
特点：Intel Core i7 处理器，16GB RAM，1TB HDD，NVIDIA GeForce GTX 1660
描述：一款功能强大的台式电脑，适用于工作和娱乐。
价格：$999.99

产品：BlueWave Chromebook
类别：计算机和笔记本电脑
品牌：BlueWave
型号：BW-CB100
保修期：1 年
评分：4.1
特点：11.6 英寸显示屏，4GB RAM，32GB eMMC，Chrome OS
描述：一款紧凑而价格实惠的 Chromebook，适用于日常任务。
价格：$249.99

步骤 3:{delimiter} 如果消息中包含上述列表中的产品，请列出用户在消息中做出的任何假设，\
例如笔记本电脑 X 比笔记本电脑 Y 大，或者笔记本电脑 Z 有 2 年保修期。

步骤 4:{delimiter} 如果用户做出了任何假设，请根据产品信息确定假设是否正确。

步骤 5:{delimiter} 如果用户有任何错误的假设，请先礼貌地纠正客户的错误假设（如果适用）。\
只提及或引用可用产品列表中的产品，因为这是商店销售的唯一五款产品。以友好的口吻回答客户。

使用以下格式回答问题：
步骤 1: {delimiter} <步骤 1 的推理>
步骤 2: {delimiter} <步骤 2 的推理>
步骤 3: {delimiter} <步骤 3 的推理>
步骤 4: {delimiter} <步骤 4 的推理>
回复客户: {delimiter} <回复客户的内容>

请确保每个步骤上面的回答中中使用 {delimiter} 对步骤和步骤的推理进行分隔。
"""

3.2 用户测试

例子1:

from tool import get_completion_from_messages

user_message = f"""BlueWave Chromebook 比 TechPro 台式电脑贵多少？"""

messages =  [  
{'role':'system', 
 'content': system_message},    
{'role':'user', 
 'content': f"{delimiter}{user_message}{delimiter}"},  
] 

response = get_completion_from_messages(messages)
print(response)

步骤 1: 用户询问了关于产品价格的问题。
步骤 2: 用户提到了两个产品，其中一个是BlueWave Chromebook，另一个是TechPro 台式电脑。
步骤 3: 用户假设BlueWave Chromebook比TechPro 台式电脑贵。
步骤 4: 根据产品信息，我们可以确定用户的假设是错误的。
回复客户: BlueWave Chromebook 的价格是 $249.99，而 TechPro 台式电脑的价格是 $999.99。因此，TechPro 台式电脑比 BlueWave Chromebook 贵 $750。

例子2:

user_message = f"""你有电视机么"""
messages =  [  
{'role':'system', 
 'content': system_message},    
{'role':'user', 
 'content': f"{delimiter}{user_message}{delimiter}"},  
] 
response = get_completion_from_messages(messages)
print(response)

步骤 1: 我们需要确定用户是否正在询问有关特定产品或产品的问题。产品类别不计入范围。

步骤 2: 在可用产品列表中，没有提到任何电视机产品。

回复客户: 很抱歉，我们目前没有可用的电视机产品。我们的产品范围主要包括计算机和笔记本电脑。如果您对其他产品有任何需求或疑问，请随时告诉我们。

4. 参考

https://datawhalechina.github.io/llm-cookbook/#/

欢迎关注本人，我是喜欢搞事的程序猿；一起进步，一起学习；

欢迎关注知乎/CSDN：SmallerFL

也欢迎关注我的wx公众号（精选高质量文章）：一个比特定乾坤

在这里插入图片描述

SmallerFL

关注

12
点赞
踩
16

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录