思维树TOT：大语言模型的深思问题求解方法

三谷秋水

已于 2024-07-30 21:05:18 修改

阅读量577

点赞数 12

分类专栏：人工智能大模型机器学习文章标签：语言模型人工智能自然语言处理

于 2024-07-22 01:01:24 首次发布

本文链接：https://blog.csdn.net/yorkhunter/article/details/140522468

版权

大模型同时被 3 个专栏收录

737 篇文章

订阅专栏

机器学习

557 篇文章

订阅专栏

人工智能

426 篇文章

订阅专栏

23年5月来自普林斯顿和谷歌deepmind的一篇大语言模型论文“Tree of Thoughts: Deliberate Problem Solving with Large Language Models“。

语言模型越来越多地用于解决各种任务的通用问题，但在推理过程中仍然局限于token级、从左到右的决策过程。这意味着他们可能会在需要探索、战略展望或哪里初始决策才能发挥关键作用等任务中达不到要求。为了克服这些挑战，该文引入了一种语言模型推理框架“思维树”，概括了流行的“思维链”(ToT)方法来提示语言模型，并能够探索连贯的文本单元（“思想”），作为解决问题的中间步骤。ToT允许LM考虑多种不同的推理路径和自我评估选择来决定下一步行动方案，在必要时向前看或回溯。再做出全局选择，从而执行深思熟虑的决策。实验表明，ToT增强了语言模型在三个需要规划或搜索的新任务上解决问题的能力，如下表所示。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-y1UWccL7-1721581262565)(https://i-blog.csdnimg.cn/direct/41934b61e70d465ebfbc0874ac02de3e.png)]