大语言模型——少样本与零样本的思维链提示（Few-Shot & Zero-Shot CoT Prompting）详解

DuHz

已于 2025-03-13 10:00:20 修改

阅读量650

点赞数 18

文章标签：语言模型人工智能机器学习信息与通信信号处理自然语言处理算法

于 2025-03-03 21:56:43 首次发布

本文链接：https://blog.csdn.net/qq_44648285/article/details/146000605

版权

引言

在大语言模型（Large Language Model, LLM）中，“思维链”提示（Chain of Thought Prompting，CoT）指的是让模型显式产出中间推理步骤，帮助其在回答复杂问题时更可靠、更具可解释性。根据是否在提示中提供示例来演示“如何写出思维链”，CoT可分为：

少样本思维链提示（Few-Shot CoT Prompting）：在提示中包含若干带有思维链的示例。
零样本思维链提示（Zero-Shot CoT Prompting）：仅用文字指令“要求模型给出思维过程”，不提供具体思维链示例。

二者都旨在提高大语言模型的推理质量。本文将结合更多数学公式，深入剖析Few-Shot与Zero-Shot CoT的核心原理与实现方式。

思维链（Chain of Thought, CoT）简述

思维链（CoT）可以理解为一条从问题 $Q$ 到答案 $A$ 的显式“推理路径”。在生成式语言模型中，若我们让模型在输出最终答案前，先写出一段（或多段）文本来阐明它的思考过程（例如逻辑、计算步骤等），就能显著减少“跳步”或错误回答，并且为人类用户提供可解释的中间结论。

在数学上，可将思维链 $C$ 视为问题 $Q$ 与答案 $A$ 之间的某个中间（或辅助）变量。当我们只看最终答案时，模型实际上暗含了一个对 $C$ 的内部推理；而当我们使用CoT提示时，就让这个内部推理在最终输出中得以显式呈现。

少样本思维链提示（Few-Shot CoT Prompting）

定义与动机

少样本（Few-Shot）：在给模型的提示（Prompt）里，先提供少量“带有思维链的示例”作为范例，然后再提出新的问题，期望模型按类似形式输出“思维链 + 答案”。
动机：
1. 示范学习（in-context learning）：大模型会从提示示例中“模仿”如何先写出推理过程，再得出结论；
2. 复杂任务的可解释性：某些任务（如数学题、逻辑推断）需要多步推理；示例能让模型更轻松地抓住如何分步思考；
3. 减少幻觉与错误：拥有思维链示例后，模型更倾向于“循迹”而不是无中生有地跳到答案。

数学模型

在Few-Shot场景下，假设我们给模型提供了 $k$ 个示例，记为
$\Bigl\{(Q_1, C_1, A_1),\, (Q_2, C_2, A_2), \dots, (Q_k, C_k, A_k)\Bigr\},$
并且我们还有一个新问题 $Q_{\text{new}}$ ，要求模型输出
$Y_{\text{new}} = (C_{\text{new}}, A_{\text{new}}).$
这里：