思维图GOT:用大语言模型解决复杂问题

179 篇文章 0 订阅
174 篇文章 1 订阅

23年8月份来自瑞士和波兰的大学以及一个数据公司Cledar的大语言模型论文“ Graph of Thoughts: Solving Elaborate Problems with Large Language Models“。

思维图(GoT)是一个框架,提高大型语言模型(LLM)中的提示功能,超出思维链或思维树(ToT)等范式所提供的能力。GoT的关键思想和主要优势是能够将LLM生成的信息建模为任意图,其中信息单位(“LLM思维”)是顶点,边对应于这些顶点之间的依赖关系。这种方法可以将任意LLM思维组合成协同结果,提炼整个思维网络(network)的本质,或用反馈循环增强思维。GoT在不同任务上比最先进的技术更具优势,例如,与ToT相比,排序质量提高了62%,同时将成本降低了>31%。确保GoT可以通过新思维转换进行扩展,因此可用于引领新提示方案。GoT使LLM推理更接近人类思维或大脑机制(如重现),两者都形成了复杂网络。

将推理过程建模为有向图 G =(V,E),其中V 是顶点集,E是边缘集。顶点包含手头问题的解决方案(无论是初始、中级还是最终问题)。这种思维的具体形式取决于用例;它可以是一个段落(在写作任务中)或一个数字序列(在排序中)。有向边(t1,t2)表示思维t2是用思维t1作为“直接输入”构建的,即通过显式指示LLM用t1生成t2。

在某些用例中,图节点属于不同的类。例如,在编写任务中,一些顶点对编写段落的计划(plan)进行建模,而其他顶点对文本的实际段落(par)进行建模。在这种情况下,GoT采用异构图G = (V, E, c)来模拟LLM的生成,其中c将顶点V映射到各自的C类(上述情况下,C = {plan, par})。因此,任何顶点 v 都可以模拟推理的不同方面。

文章将GoT与LLM推理过程联系起来。为了推进这个过程,将思维转换应用于G。这种转变的一个例子是将得分最高的思维(到目前为止)合并到一个新思维中。另一个例子是循环考虑一个思维,增强它。请注意,这些转换结构严格扩展了CoT,CoT-SC(自一致性的多CoT)或ToT中可用的转换集。

如图即GoT和其他提示方法的比较:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fT9kHRnk-1721581314971)(https://i-blog.csdnimg.cn/direct/6dbe4c80c2dd4af48f751ea660d9cb9d.png)]

GoT通过基于图的推理模型实现了思维的新转变,称为图赋能的转换。例如,在写作中,可以将几篇输入文章合并为一个连贯的摘要。在排序中,可以将几个排序的数字子数组合并到一个最终的排序数组中。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4a4sqWo8-1721581314972)(https://i-blog.csdnimg.cn/direct/f7ddcc39a2f143d2b001a9c45289aaaf.png)]

如图是GoT 架构,其一组交互模块组成(蓝色部分)。这些模块是提示器(为 LLM 准备消息)、解析器(从 LLM 的回复中提取信息)、评分模块(验证和评分 LLM 回复)和控制器(协调整个推理过程,并决定如何进行)。控制器还包含两个重要元素:操作图(GoO)和图推理状态(GRS)。GoO是一种静态结构,指定给定任务的图分解,即规定了应用于LLM思维的转换,以及顺序和依赖关系。GRS是一个动态结构,维持正在进行的LLM推理过程状态(其思维和状态的历史记录)。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3m37L93O-1721581314972)(https://i-blog.csdnimg.cn/direct/0444696e56aa42caa55abc397e4212e4.png)]

用户构建一个GoO实例,该实例规定了思维操作的执行计划。GoO 在执行开始之前构造一次。每个操作目标都知道其前置操作和 后续操作。然后,在执行过程中,GoO 实例维护有关 LLM 推理过程中不断更新的信息。这包括到目前为止执行了哪个操作、所有生成的LLM思维的状态、有效性和分数、以及任何其他相关信息。上述元素提供了可扩展的 API,支持直接实现不同的提示方案。这些 API 在图 的绿色部分进行了概述,并在文档中进行了详细说明。

另外还提供了这些操作使用的提示示例,并在下图红色部分中提供了相应的GRS。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xAGrCtwC-1721581314973)(https://i-blog.csdnimg.cn/direct/6452d72bdbcf404baf70513bbb6fe779.png)]

  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值