少样本提示与思维链提示：从基础到进阶的自然语言处理实践-CSDN博客

本文链接：https://blog.csdn.net/The_Thieves/article/details/148047716

在自然语言处理（NLP）领域，如何让大型语言模型（LLM）高效解决复杂任务一直是开发者的核心挑战。零样本提示虽便捷，但在逻辑推理、多步计算等场景中容易「卡壳」。本文结合中文语境，详解少样本提示与思维链提示的核心原理、实战技巧及自动化方案，助你快速提升模型性能。

少样本提示的本质，是通过提供 1-10 个任务示例，让模型从具体案例中归纳规律。例如，教模型用新词「齁甜」造句时，只需 1 个示例：

text

提示：这杯奶茶三分糖还是齁甜，下次得选无糖。  
用「齁甜」造一个句子：  
输出：妈妈做的蜂蜜蛋糕齁甜，吃完得赶紧喝杯水。

模型通过示例学会「形容词 + 场景描述」的造句结构，这比纯文字指令更直观高效。

即使标签随机分配，只要保持格式一致，模型仍能捕捉规律。例如情感分类：

text

提示：  
这道菜太咸了！//Negative  
这家店服务周到！//Positive  
地铁有人让座，暖～//  
输出：Positive

用「//」分隔文本与标签，符合中文阅读习惯，模型通过模式匹配即可分类。

简单任务（如词性判断）：1-3 个示例足够
复杂任务（如逻辑推理）：5-10 个示例更稳定
反常识发现：随机标签示例（如将「好评」标为 Negative）仍比无标签场景准确率高 42%（Min et al. 2022）。

避免抽象示例，优先选择日常场景。例如教模型识别「因果关系」：

text

提示：  
因为下雨，所以我带了伞。→包含因果关系  
他早起但没赶上公交。→不包含因果关系  
今天降温，我穿了羽绒服。→  
输出：包含因果关系

通过「天气 - 行为」关联的具体场景，模型更容易理解逻辑关系。

思维链（CoT）提示的关键，是将推理过程显式拆解为中间步骤。例如计算「买苹果剩余数量」：

text

问题：买了15个橘子，分5个给朋友，又买8个，吃了3个，还剩多少？  
提示：  
让我们逐步思考：  
1. 初始15个-分5个→10个  
2. 10个+买8个→18个  
3. 18个-吃3个→15个  
答案：15个

通过「1.→2.→3.」的序数词引导，模型避免了直接跳跃到答案的错误（如漏算购买步骤）。

从条件出发，逐步推导结果：

text

问题：北京到上海高铁里程1300公里，时速300公里，多久到达？  
提示：  
1. 时间=里程÷时速→1300÷300≈4.33小时  
2. 考虑停靠时间→约4.5小时  
答案：约4.5小时

从结论倒推必要条件：

text

问题：为什么加油站不能打电话？  
提示：  
1. 加油站有可燃气体  
2. 打电话可能产生电火花  
3. 电火花遇气体易爆炸  
结论：禁止打电话

用数字序号 + 短句拆分因果链，符合中文读者「先分述后总结」的思维习惯。

即使没有示例，在问题后加「让我们逐步思考」，也能触发模型的隐性推理能力：

text

问题：100以内能被3和5整除的最大数是多少？  
普通输出：90（正确但无过程）  
零样本CoT输出：  
能被3和5整除即能被15整除→100÷15≈6.66→最大整数6×15=90  
答案：90

该方法对 GPT-3 及以上模型效果显著，中文语境下需注意用词精准（如用「整除」而非「除尽」）。

传统思维链需人工撰写每个问题的步骤，1000 个问题需 500 + 小时。Auto-CoT 通过两步自动化：

中文案例：

text

输入问题：「如何煮米饭？」「米饭煮糊了怎么办？」  
聚类结果：  
组1（方法类）：如何煮米饭？  
组2（故障类）：米饭煮糊了怎么办？  
生成推理链：  
组1：1. 洗米→2. 加水→3. 煮饭  
组2：1. 关火→2. 开盖散热→3. 铺面包吸糊味

适用场景：客服问答、教育题库、工业流程指引等需要批量生成步骤的场景。