大模型推理方式梳理

sinat_33545336

已于 2024-09-29 20:45:37 修改

阅读量167

点赞数 3

分类专栏： NLP相关梳理文章标签： nlp

于 2024-09-29 20:16:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_33545336/article/details/142642785

版权

NLP相关梳理专栏收录该内容

2 篇文章

订阅专栏

COT

目前最常用的训练思路，通过模拟人类逐步推导答案的思维方式，将复杂推理过程分解为一系列简单、可理解的步骤。不做赘述。

针对cot格式的研究很多，看过一些论文，有的论文结论是cot在zero shot的推理上主要是数学推导起作用。另外在是否做格式化上，推理任务中，格式限制越强，模型性能越差；分类任务上，格式限制越强，模型性能越好。在我的实际验证中，通常为底线类是否违规的判断，基本上都是格式化越规范，效果越好的结论。

COT-SC

思维链自洽性。就是对同一个问题提供多种推理思路，从候选的推理思路中选择一致性答案作为最终的答案。
在这里插入图片描述

TOT

系统将一个问题分解，并生成一个潜在推理步骤或“思维”候选者列表。然后，对这些想法进行评估，系统会衡量每个想法产生所需解决方案的可能性。用广搜+深搜实现。from：https://www.promptingguide.ai/techniques/tot

以树的形式组织其解决问题的策略，单个树节点代表部分解决方案。基于给定的节点，思维生成器（thought generator）可以构造出一定数量的新节点，然后用状态评估器（state evaluator）为每个新节点生成相应评分。

根据用例的不同，可以使用LLM自身对输出结果进行评估，也可以利用人工评分等。
在这里插入图片描述

GOT

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。