动手学大模型LLM应用开发之提示词工程（Prompt Engineering）

最新推荐文章于 2025-03-18 17:15:45 发布

lcx_nanmu

最新推荐文章于 2025-03-18 17:15:45 发布

阅读量4.2k

点赞数 10

分类专栏：动手学大模型应用开发文章标签： prompt python 人工智能 gpt-3 文心一言 chatgpt 自然语言处理

本文链接：https://blog.csdn.net/lcx_nanmu/article/details/137929812

版权

动手学大模型应用开发专栏收录该内容

3 篇文章

订阅专栏

一、什么是提示词工程(Prompt Engineering)？

提示工程(Prompt Engineering)是一个相对较新的研究方向，用于研究如何编写和优化提示池，以便更好、更有效地使用大语言模型。
我们每一次访问大模型，给模型的输入就是 Prompt，大模型给我们的返回结果我们称之为 Completion。
在这里插入图片描述

二、Prompt 设计的原则及使用技巧

一个好的 Prompt 设计极大地决定了其能力的上限与下限。设计高效 Prompt 有两个关键原则编写清晰、具体的指令和给予模型充足思考时间

原则一：编写清晰、具体的指令

1、使用分隔符清晰地表示输入的不同部分

在编写 Prompt 时，我们可以使用各种标点符号作为“分隔符”，将不同的文本部分区分开来。分隔符就像是 Prompt 中的墙，将不同的指令、上下文、输入隔开，避免意外的混淆。你可以选择用 ```，“”"，< >，，: 等做分隔符，只要能明确起到隔断作用即可。

在以下的例子中，我们给出一段话并要求 LLM 进行总结，在该示例中我们使用 ```来作为分隔符:

（1）、首先，我们调用 OpenAI 的 API ，封装一个对话函数，使用 gpt-3.5-turbo 这个模型。

import os
from openai import OpenAI
from dotenv import load_dotenv, find_dotenv


# 如果你设置的是全局的环境变量，这行代码则没有任何作用。
_ = load_dotenv(find_dotenv())

client = OpenAI(
    # This is the default and can be omitted
    # 获取环境变量 OPENAI_API_KEY
    api_key=os.environ.get("OPENAI_API_KEY"),
    # 访问api的网址,中转api需设置
    base_url=os.environ.get("OPENAI_BASE_URL")
)

# 如果你需要通过代理端口访问，还需要做如下配置
os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890'
os.environ["HTTP_PROXY"] = 'http://127.0.0.1:7890'

# 一个封装 OpenAI 接口的函数，参数为 Prompt，返回对应结果
def get_completion(prompt,
                   model="gpt-3.5-turbo"
                   ):
    '''
    prompt: 对应的提示词
    model: 调用的模型，默认为 gpt-3.5-turbo(ChatGPT)。你也可以选择其他模型。
           https://platform.openai.com/docs/models/overview
    '''

    messages = [{"role": "user", "content": prompt}]

    # 调用 OpenAI 的 ChatCompletion 接口
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=0
    )

    return response.choices[0].message.content

（2）、对比分析使用分隔符和不使用分隔符的大模型回答的效果

使用分隔符运行效果：
在这里插入图片描述
不使用分隔符运行效果：

总结：通过以上实验我们可以看出，使用分隔符能够有效的让大模型明白我们的用途，防止歧义。

2、寻求结构化的输出

有时候我们需要语言模型给我们一些结构化的输出，而不仅仅是连续的文本。希望大模型能够给我们返回按照某种格式组织的内容，例如 JSON、HTML 等，这种结构能够让我们方便在代码中处理。

在以下示例中，我们要求 LLM 生成三本书的标题、作者和类别，并要求 LLM 以 JSON 的格式返回给我们，为便于解析，我们指定了 JSON 的键名。
在这里插入图片描述

3、要求模型检查是否满足条件

如果任务包含不一定能满足的假设（条件），我们可以告诉模型先检查这些假设，如果不满足，则会指出并停止执行后续的完整流程。您还可以考虑可能出现的边缘情况及模型的应对，以避免意外的结果或错误发生。

在如下示例中，我们将分别给模型两段文本，分别是制作茶的步骤以及一段没有明确步骤的文本。我们将要求模型判断其是否包含一系列指令，如果包含则按照给定格式重新编写指令，不包含则回答“未提供步骤”。
在这里插入图片描述
上述示例中，模型可以很好地识别一系列的指令并进行输出。在接下来一个示例中，我们将提供给模型
没有预期指令的输入，模型将判断未提供步骤。

4、提供少量示例

“Few-shot” prompting（少样本提示），即在要求模型执行实际任务之前，给模型提供一两个参考样例，让模型了解我们的要求和期望的输出样式。

例如，在以下的样例中，我们先给了一个 {<学术>:<圣贤>} 对话样例，然后要求模型用同样的隐喻风格回答关于“孝顺”的问题，可以看到 LLM 回答的风格和示例里<圣贤>的文言文式回复风格是十分一致的。这就是一个 Few-shot 学习示例，能够帮助模型快速学到我们要的语气和风格。
在这里插入图片描述
总结：利用少样本样例，我们可以轻松“预热”语言模型，让它为新的任务做好准备。这是一个让模型快速上手新
任务的有效策略。