【LLM 论文】Least-to-Most Prompting 让 LLM 实现复杂推理

最新推荐文章于 2024-07-12 16:23:13 发布

yubinCloud

最新推荐文章于 2024-07-12 16:23:13 发布

阅读量1.3k

点赞数 20

分类专栏： LLM Research 文章标签：人工智能深度学习机器学习语言模型自然语言处理

本文链接：https://blog.csdn.net/qq_45668004/article/details/138633830

版权

LLM Research 专栏收录该内容

43 篇文章 12 订阅

订阅专栏

论文：Least-to-Most Prompting Enables Complex Reasoning in Large Language Models

⭐⭐⭐

Google Research, ICLR 2023

论文速读

Chain-of-Thought（CoT） prompting 的方法通过结合 few-show prompt 的思路，让 LLM 能够挑战更具复杂性的问题。但是 CoT 的方法存在一个关键限制：它在需要泛化性来解决比 demonstration examples 更困难的问题的 task 上，通常表现不佳。

为了克服这个缺点，本论文提出了 least-to-most prompting 的方法，它先让 LLM 将原来的问题分解为多个需要预先解决的 sub-questions，然后依次按顺序让 LLM 去解决这些 sub-questions，在解决每个 sub-question 的时候，LLM 可以看到之前的每个 sub-question 以及回复。如下图：

可以看到，它包含两个 stage，每个 stage 都是通过 few-shot prompt 来实现的，并且整个过程没有任何 model 被训练：

Decomposition：这个阶段的 prompt 包含固定的几个用于演示 decomposition 的 few-shot exemplars，然后跟着需要被 decomposed 的 question
Subproblem solving：这个阶段的 prompt 包含三个部分：
- 固定的几个用于演示 subproblem 如何被解决的 few-shot exemplars
- 先前已经被 LLM 回答了的 subquestions 以及对应的生成的回答
- 接下来需要被回答的 question

最终，原先的 user question 作为最后一个 subquestion 被 LLM 解决。

实验

论文做了 symbolic manipulation、compositional generalization 和 math reasoning tasks 三个实验，并主要与 CoT 进行了对比。

总的来说，本文提出的 Least-to-Most Prompting 相比于 CoT 的优势主要在于：

在长度泛化方面更好。面对比 few-shot exemplars 更长的问题，比 CoT 解决地更好
在困难泛化方面更好。面对比 few-shot exemplars 更困难的问题，也比 CoT 解决地更好

总结与分析

论文指出，该方法的 decomposition prompt 不能很好地跨域泛化，在一个 domain 上 decomposition 的示例无法有效地用在另一个 domain（task）上。

总的来说，本工作提出了 least-to-most prompting 的方法，通过自顶向下的问题分解和自底向上的子问题解决实现了最终的解决问题。在该方法中，prompt 由以前的单向与 LLM 交流变成了双向的互动。通过双向交互来指导 LLM 仍然值得探索。
pt 由以前的单向与 LLM 交流变成了双向的互动。通过双向交互来指导 LLM 仍然值得探索。

yubinCloud

关注

20
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
【LLM 论文】Least-to-Most Prompting 让 LLM 实现复杂推理

论文指出，该方法的 decomposition prompt 不能很好地跨域泛化，在一个 domain 上 decomposition 的示例无法有效地用在另一个 domain（task）上。总的来说，本工作提出了 least-to-most prompting 的方法，通过自顶向下的问题分解和自底向上的子问题解决实现了最终的解决问题。在该方法中，prompt 由以前的单向与 LLM 交流变成了双向的互动。通过双向交互来指导 LLM 仍然值得探索。pt 由以前的单向与 LLM 交流变成了双向的互动。
复制链接

扫一扫

专栏目录