大模型提示词工程：从基础到实战的全面指南

最新推荐文章于 2025-05-20 22:27:03 发布

敲键盘的小夜猫

最新推荐文章于 2025-05-20 22:27:03 发布

阅读量620

点赞数 11

分类专栏： python 大语言模型文章标签： python

本文链接：https://blog.csdn.net/qq_30294911/article/details/148060526

版权

大语言模型同时被 2 个专栏收录

14 篇文章

订阅专栏

python

10 篇文章

订阅专栏

在人工智能迅猛发展的今天，提示词工程（Prompt Engineering）已成为与大语言模型高效协作的关键技能。本文深入剖析了这门"AI沟通艺术"的核心要素与实战技巧，从提示词的四大构成（角色设定、任务描述、格式规范、约束条件）到实际应用场景的最佳实践，为读者提供了系统化的学习路径。文章不仅对比了优劣提示词案例，还通过LangChain框架展示了如何构建结构化、可复用的提示模板，以及如何有效管理多轮对话中的上下文窗口。特别值得关注的是，文中介绍的ChatPromptTemplate高级应用和领域专家系统实现，为开发者提供了直接可用的代码范例。
想知道如何让AI像"数字员工"一样精准执行任务？如何避免Token浪费提升效率？阅读本文，掌握AI时代的必备沟通技能。

引言：掌握AI沟通的艺术

在人工智能快速发展的今天，大型语言模型(LLM)已成为改变各行各业的关键技术。然而，要充分发挥这些模型的潜力，我们需要掌握一门新的技能——提示词工程(Prompt Engineering)。正如一位优秀的管理者需要清晰地表达任务需求，我们与AI的沟通也需要精准、有效的指令设计。

本文将带您深入了解提示词工程的核心概念、设计原则和实战技巧，从理论到实践，帮助您成为AI时代的"沟通专家"。无论您是开发者、产品经理还是AI爱好者，掌握这些技能都将显著提升您与大模型协作的效率。

第一部分：提示词工程基础

1.1 什么是提示词工程？

提示词工程是通过精心设计的文本输入来引导AI模型生成期望输出的技术。它不仅是用户与大语言模型之间的桥梁，更是确保AI理解需求并生成准确回答的基础。

从本质上看，提示词工程可以类比为给一位高级程序员下达任务需求：

传统编程：编写代码 → 计算机执行
提示词工程：编写自然语言指令 → 大模型生成结果

为什么需要学习提示词工程？

在AI时代，大模型就像您的"数字员工"。无论是OpenAI的GPT系列、DeepSeek、阿里的千问还是其他模型，它们都需要清晰的指令才能发挥最大价值。作为"老板"的您，需要学会如何:

准确描述任务需求
设定合理的期望
明确交付目标和标准

掌握提示词工程，就是掌握了与这些强大"数字员工"高效协作的能力。

1.2 Prompt设计四要素

优质的提示词设计通常包含四个关键要素：

1.2.1 角色设定（Role Prompting）

角色设定限定了模型回答的视角和专业领域，能显著提升回答质量。

差的示例	优质示例
写一首关于春天的诗	你是一位擅长写现代诗的诗人，请用比喻手法创作一首8行的春天主题短诗

1.2.2 任务描述

清晰的任务描述可遵循STAR原则：

Situation (场景)：背景环境
Task (任务)：需要完成什么
Action (行动)：如何执行
Result (结果)：期望的输出

例如：

(场景) 用户提交了一个关于Java并发编程的技术问题
(任务) 需要给出准确且易懂的解答
(行动) 分步骤说明解决方案，并提供代码示例
(结果) 最后用一句话总结核心要点

1.2.3 格式规范

指定输出的结构和格式，有助于获得更易于处理的结果：

请用JSON格式输出包含以下字段：
{
  "summary": "不超过50字的摘要",
  "keywords": ["关键词1", "关键词2", "关键词3"],
  "difficulty": "初级/中级/高级"
}

常用格式指令包括：分点列表、指定段落数、表格呈现、代码格式等。

1.2.4 约束条件

约束条件帮助模型在特定范围内生成回答：

约束类型	示例
长度	“答案控制在200字内”
风格	“用初中生能理解的语言”
内容	“不包含专业术语”
逻辑	“先解释概念再举例说明”

1.3 提示词模板与问题排查

一个完整的提示词模板通常包括以上四个要素：

[角色设定]
你是一个具有10年经验的{领域}专家，擅长{特定技能}

[任务说明]
需要完成以下任务：
1. {步骤1}
2. {步骤2}
3. {步骤3}

[输出要求]
请按照以下格式响应：
{示例格式}

[约束条件]
{具体限制}

当遇到提示词效果不佳时，可参考以下排查指南：

现象	可能原因	解决方案
输出内容偏离主题	角色设定不明确	添加"忽略无关信息"约束
生成结果过于笼统	缺少具体步骤要求	添加"分步骤详细说明"指令
格式不符合要求	未提供明确格式示例	添加XML/JSON标记示例

第二部分：提示词工程最佳实践案例

2.1 通用回答优化案例

问题场景

用户需要了解人工智能的基本信息

差的提示词

告诉本人关于人工智能的信息

问题分析：

过于宽泛，缺乏焦点
未指定回答深度和范围
没有明确期望的格式
可能得到从历史发展到技术原理的冗长概述

优化后的提示词

你是一位科技专栏专家，请用通俗易懂的方式向高中生解释：
1、什么是人工智能（用1个学生日常生活场景说明）
2、列举3个当前主要应用场景及其影响
3、内容控制在300字以内
要求使用"首先"、"其次"、"最后"的结构

优化点：

设定明确角色（科技专栏专家）
明确目标受众（高中生）
结构化输出要求（三部分内容）
添加格式和长度约束
要求使用具体例子增强理解

2.2 代码生成优化案例

问题场景

需要生成一个特定功能的Python程序

差的提示词

写个python程序

问题分析：

没有具体功能描述
未指定输入输出格式
忽略异常处理需求
可能生成简单的"Hello World"程序

优化后的提示词

编写一个Python函数，实现以下功能：
输入：字符格式的日期（格式：YYYY-MM-DD）
输出：该日期对应的季度（1-4）

要求：
1. 包含参数校验（不符合格式时抛出ValueError）
2. 使用datetime模块
3. 编写对应的单元测试用例

示例：
输入"2024-03-15" → 返回 1

优化点：

明确定义输入输出
指定实现方式和技术要求
包含异常处理要求
提供测试用例和示例验证

2.3 技术问答优化案例

问题场景

需要网站性能优化建议

差的提示词

如何优化网站性能？

问题分析：

问题范围过大
未说明技术栈
缺少评估标准
可能得到泛泛而谈的通用建议

优化后的提示词

针对使用SpringBoot+Vue3技术栈的电商网站，请给出5项可量化的性能优化方案：

要求：
1. 每项方案包含：
   - 实施步骤
   - 预期性能提升指标（如响应时间减少20%）
   - 实施难度评估（低/中/高）
   - 优先级建议

2. 引入Web Vitals优化标准进行评估

3. 限制条件：
   - 不使用服务端渲染等需要硬件升级的方案
   - 排除已广泛采用的基础方案（如代码压缩、图片优化）

4. 针对我们面临的高并发下单场景提供专门优化建议

优化点：

限定技术范围和应用场景
结构化响应要求
设定评估标准
排除基础方案
指定特殊场景需求

2.4 数据分析优化案例

问题场景

需要分析销售数据并提供洞察

差的提示词

分析这份销售数据

问题分析：

未说明数据特征
没有指定分析方法
缺少可操作化要求
可能得到无重点的描述性统计

优化后的提示词

你是一位资深数据分析师，请完成以下任务：

数据特征：
- 时间范围：2023年1-12月
- 字段：日期/产品类别/销售额/利润率

要求：
1. 找出销售额前5的月份，分析增长原因
2. 识别利润率低于5%的产品类别并提出改进建议
3. 生成季度趋势图的Markdown格式报告

输出格式：
## 分析报告
### 关键发现
1. 要点1（数据支持）
   - 细节1（对比分析）
### 改进建议
1. 建议1（预期效果）
### 趋势可视化
```图表描述，生成base64编码的折线图```

优化点：

明确数据特征和范围
指定具体分析任务
要求提供可操作的建议
设定结构化输出格式
要求视觉化呈现结果

第三部分：LangChain提示模板技术实现

3.1 PromptTemplate基础

在这里插入图片描述

LangChain是一个流行的大模型应用开发框架，其中PromptTemplate组件专门用于构建结构化提示词。它能将用户输入和动态数据转换为LLM可理解的格式，解决了以下问题：

动态内容组装：避免提示词硬编码
模板复用：标准化提示词结构
参数化控制：灵活调整提示词变量

PromptTemplate核心组件

template：定义模板格式，使用{变量名}作为占位符
input_variables：声明模板中可使用的变量
partial_variables：预定义变量，可提前填充
format：填充占位符生成最终文本的方法

基本使用案例

from langchain.prompts import PromptTemplate

# 定义模板
template = """
你是一位专业的{domain}顾问，请用{language}回答：
问题：{question}
回答：
"""

# 创建实例
prompt = PromptTemplate(
    input_variables=["domain", "language", "question"],
    template=template
)

# 格式化输出
formatted_prompt = prompt.format(
    domain="网络安全",
    language="中文",
    question="如何防范钓鱼攻击？"
)

使用预置变量

from langchain.prompts import PromptTemplate

template = """
%{analysis_type}：
用户输入：{user_input}
分析结果：
"""

prompt_template = PromptTemplate(
    input_variables=["user_input"],
    template=template,
    template_format="string",
    partial_variables={"analysis_type": "情感极性分析"}  # 预置变量
)

formatted_prompt = prompt_template.format(user_input="这个产品太难用了")

3.2 PromptTemplate结合LLM实战

LangChain的真正威力在于将提示模板与大语言模型无缝集成：

from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate

# 初始化LLM
llm = ChatOpenAI(
    model_name="qwen-plus",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    api_key="YOUR_API_KEY",
    temperature=0.7
)

# 创建Prompt
prompt = PromptTemplate(
    input_variables=["product"],
    template="为{product}写三个吸引人的广告标语，只需要返回纯文本"
)

# 调用LLM
message = prompt.invoke({'product': '汤臣一品高端公寓'})
response = llm.invoke(message)

# 解析输出
output_parser = StrOutputParser()
answer = output_parser.invoke(response)
print(answer)

这种模式的优势在于：

分离提示词逻辑与模型调用
便于调试和优化提示词
支持复杂的输入处理和输出解析

第四部分：聊天模型与多轮对话技术

4.1 ChatModel基础概念

聊天模型(ChatModel)是专为多轮对话场景设计的大语言模型，相比传统文本生成模型，它具有以下核心特点：

特性	说明	示例场景
上下文感知	追踪多轮对话历史，理解指代关系	用户问"什么是量子计算"后再问"它有什么应用"，模型能正确理解"它"指代量子计算
角色扮演能力	可设定特定角色并保持一致性	设定为"医疗助手"时，提供健康信息但拒绝具体诊断
意图识别	解析用户深层需求	识别"我的订单没收到"为物流投诉，而非一般咨询
情感分析	识别用户情绪，调整回复语气	用户表达不满时，回复更加礼貌和解决问题导向
安全过滤	避免生成有害内容	拒绝生成可能有害的内容并给出合理解释

ChatModel与传统Text Model对比

对比维度	ChatModel	传统Text Model
核心目标	多轮交互式对话	单次文本生成
输入格式	结构化消息序列	纯文本提示
上下文处理	自动管理对话历史	需手动拼接历史文本
输出控制	内置安全审查和格式约束	依赖提示词工程控制
典型应用	客服机器人、虚拟助手	内容创作、数据处理

4.2 聊天模型的角色体系

聊天模型通过角色化消息实现对话控制，核心角色包括：

角色类型	标识符	功能定位	使用场景示例
System	system	定义AI行为准则和角色设定	“你是一位医疗助手，不提供诊断但可以分享健康知识”
User	user/human	代表用户的输入信息	“如何缓解头痛?”
Assistant	assistant/ai	存储AI的历史回复	“建议充分休息，保持水分摄入…”

多轮对话示例代码

messages = [
    {"role": "system", "content": "你是一个电影推荐助手"},
    {"role": "user", "content": "我喜欢科幻片，推荐三部经典"},
    {"role": "assistant", "content": "1.《银翼杀手2049》... 2.《星际穿越》... 3.《黑客帝国》..."},
    {"role": "user", "content": "第二个的主演是谁？"}  # 基于上下文追问
]

response = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=messages
)

print(response.choices[0].message.content)
# 输出: 《星际穿越》的主演是马修·麦康纳和安妮·海瑟薇...

4.3 Token计算与上下文窗口管理

在多轮对话场景下，理解Token计算非常重要，因为它直接影响模型的性能和成本：

多轮对话的Token累积计算

假设每轮对话中，用户输入50 Token、模型输出100 Token：

第1轮：50(输入) + 100(输出) = 150 Token
第2轮：50(新输入) + 100(新输出) + 150(历史) = 300 Token
第3轮：50(新输入) + 100(新输出) + 300(历史) = 450 Token

随着对话轮次增加，Token数量呈线性增长，最终可能达到模型的上下文窗口限制。

上下文窗口限制

不同模型有不同的上下文窗口大小：

4k Tokens：如GPT-3.5基础版(4096 Token)
8k Tokens：如GPT-4早期版本(8192 Token)
16k-32k Tokens：如GPT-4最新版本(32768 Token)
100k+ Tokens：如Claude 3 Opus(100k+ Token)

当对话历史接近这些限制时，需要采取上下文压缩或摘要策略，以保持对话的连贯性。

第五部分：ChatPromptTemplate高级应用

5.1 ChatPromptTemplate核心概念

ChatPromptTemplate是LangChain专为聊天模型设计的提示模板，相比基础PromptTemplate，它具有以下核心差异：

支持消息角色(system/user/assistant)
天然适配聊天模型(如GPT-3.5/4)
可维护对话上下文
支持函数调用

消息类型体系

消息模板类	对应角色	典型用途
SystemMessagePromptTemplate	系统消息	设定AI行为规则
HumanMessagePromptTemplate	用户消息	接收用户输入
AIMessagePromptTemplate	AI回复消息	记录历史响应
ChatPromptTemplate	容器模板	组合多个消息模板

5.2 ChatPromptTemplate常用方法

from_template方法

用于创建单条消息模板，通常需与其他方法组合使用：

from langchain_core.prompts import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate
)

# 创建系统消息模板
system_template = SystemMessagePromptTemplate.from_template(
    "你是一个{role}，请用{language}回答。"
)

from_messages方法

用于构建完整的多轮对话模板，支持不同角色消息：

from langchain_core.prompts import ChatPromptTemplate

# 通过元组列表定义角色和模板
chat_template = ChatPromptTemplate.from_messages([
    ("system", "你是一个AI助手，名字{name}。"),
    ("human", "你好，最近怎么样？"),
    ("ai", "我很好，谢谢！"),
    ("human", "{user_input}")
])

# 格式化模板并传入变量
messages = chat_template.format_messages(
    name="智能助理小明",
    user_input="你能帮我写一篇关于环保的文章吗？"
)

5.3 方法对比与选择

方法	适用场景	灵活性	代码复杂度
from_messages	多角色、多轮对话(如聊天机器人)	高	较高(需定义列表)
from_template	单角色消息模板(需组合使用)	低	简单

第六部分：LangChain聊天模型实战案例

6.1 领域专家咨询系统

这个案例展示如何创建一个专业领域的AI顾问：

from langchain_openai import ChatOpenAI
from langchain_core.messages import SystemMessage, HumanMessage

# 初始化模型
model = ChatOpenAI(
    model_name="qwen-plus",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    api_key="YOUR_API_KEY",
    temperature=0.7
)

# 构建消息列表
messages = [
    SystemMessage(content="你是一个Java高级架构师，擅长分布式系统设计，请用中文回答"),
    HumanMessage(content="解释volatile关键字的作用和在并发编程中的应用场景")
]

# 调用模型
response = model.invoke(messages)
print(response.content)

6.2 参数化领域专家系统

更灵活的实现，支持动态设置专业领域和回答风格：

from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain.prompts import (
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate
)

# 定义系统消息
system_template = SystemMessagePromptTemplate.from_template(
    "你是一个专业的{domain}专家，回答需满足：{style_guide}"
)

# 定义用户消息
human_template = HumanMessagePromptTemplate.from_template(
    "请解释：{concept}"
)

# 组合多个消息
chat_prompt = ChatPromptTemplate.from_messages([system_template, human_template])

# 格式化消息
messages = chat_prompt.format_messages(
    domain="计算机科学",
    style_guide="使用通俗易懂的语言，提供具体示例，避免过于理论化的解释",
    concept="机器学习中的过拟合问题"
)

# 初始化模型并调用
model = ChatOpenAI(
    model_name="qwen-plus",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    api_key="YOUR_API_KEY",
    temperature=0.7
)

response = model.invoke(messages)
print(response.content)

6.3 合规客服系统

适用于需要严格遵守规范的客服场景：

from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate

# 初始化模型
model = ChatOpenAI(
    model_name="qwen-plus",
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
    api_key="YOUR_API_KEY",
    temperature=0.7
)

# 创建合规客服模板
compliance_template = ChatPromptTemplate.from_messages([
    ("system", """您是{company}客服助手，必须遵守以下规则:

1. 不透露内部系统名称或技术细节
2. 不提供医疗/金融/法律专业建议
3. 遇到{transfer_cond}相关问题立即建议转人工客服
4. 保持礼貌专业的语气，优先解决客户问题"""),
    ("human", "[{user_level}用户]: {query}")
])

# 格式化消息
messages = compliance_template.format_messages(
    company="健康生活医疗咨询",
    transfer_cond="具体病情诊断、处方药推荐、医疗费用",
    user_level="VIP",
    query="感冒应该吃什么药？"
)

# 调用模型
response = model.invoke(messages)
print(response.content)