论文 | Measuring and Narrowing the Compositionality Gap in Language Models

最新推荐文章于 2024-10-07 06:31:57 发布

龙的爹2333

最新推荐文章于 2024-10-07 06:31:57 发布

阅读量592

点赞数 5

分类专栏： RAG框架文章标签：人工智能机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_49651195/article/details/140184819

版权

RAG框架专栏收录该内容

12 篇文章 0 订阅

订阅专栏

存在的问题：

关于一个复杂的多跳问题，大语言模型可以正确回答基于该问题分解的多个子问题，但是对于这个问题的最终答案大语言模型可能最终还是给不出来正确的。该论文根据这个现象提出了一个术语，叫“组合性差距”。

解决的方法：

提出一种叫“self-ask”的方法，该方法是一种基于提示工程的更高级的技术，它通过引导模型进行自我反思和问题分解，从而更好地理解问题和生成答案。

自问通过以下步骤实现：

1. 问题分解：

模型首先分析初始问题，并确定是否需要分解为更简单的子问题。
如果需要，模型会生成一个后续问题，并将其作为子问题提交给模型自身或搜索引擎。

2. 子问题回答：

模型回答生成的子问题，并返回答案。
如果子问题无法通过模型自身或搜索引擎得到答案，则可以继续生成更简单的子问题，直到得到答案为止。

3. 最终答案生成：

模型根据子问题的答案，结合自身知识，生成最终答案。

自问方法的优势：

明确的结构：自问方法通过“后续问题”和“中间答案”等提示词，清晰地标记了问题分解和答案生成的过程，使得模型更容易理解和使用。
可扩展性：自问方法可以轻松地与外部知识库（如搜索引擎）结合，进一步提升模型回答组合问题的能力。
提高准确率：自问方法可以帮助模型更好地理解问题，并避免因错误组合事实而导致的错误答案。

自问方法的局限性：

依赖模型能力：自问方法的有效性依赖于模型自身的能力，如果模型无法理解问题或生成合适的子问题，则该方法可能无法发挥作用。
计算成本：自问方法可能需要模型进行多次推理，从而增加计算成本。

评估指标（间接评估了子问题在模型组合推理中的作用）：

1. 组合推理差距：

论文主要关注“组合推理差距”，即模型正确回答所有子问题但无法得出最终答案的比例。
组合推理差距的大小可以反映模型进行组合推理的能力。
研究发现，随着模型规模的增加，组合推理差距并没有显著下降，这表明模型在组合事实方面存在局限性。

2. 子问题正确率：

论文统计了模型回答子问题的正确率，并发现模型在大多数子问题上的正确率较高。
这表明模型能够理解和回答子问题，但在将子问题答案组合成最终答案方面存在困难。

3. 模型对子问题的置信度：

论文分析了模型对子问题答案的置信度，发现模型对子问题答案的置信度越高，回答组合问题的正确率也越高。
这表明模型在进行组合推理时，需要对其自身知识有较高的置信度。

4. 自问方法的性能提升：

论文比较了自问方法和其他方法的性能，发现自问方法能够显著提高模型回答组合问题的准确率。
这表明自问方法能够帮助模型更好地理解问题和生成答案，从而缩小组合推理差距。

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄4年

56
原创

1158
点赞

1079
收藏

873
粉丝

关注

私信

热门文章

分类专栏

最新评论

代码随想录—力扣刷题笔记之字符串篇
三月七꧁ ꧂: 从前有位名叫ST的公主，每日敲键盘码字，可如今字海静悄悄，只听得见一声“催更”。
代码随想录——力扣刷题笔记之双指针法
三月七꧁ ꧂: 数日不见新博文，空余电脑待尘封。代码江湖需点墨，朋友何时续前功？
代码随想录—力扣刷题笔记之字符串篇
CSDN-Ada助手: 恭喜作者发布了第6篇博客！看到您在力扣刷题笔记之字符串篇的总结，让我受益匪浅。希望您能继续坚持创作，分享更多优质内容。同时，建议您在下一篇博客中可以尝试加入一些实际应用场景或者个人见解，让读者更加深入地了解字符串相关知识。期待您的下一篇作品！祝好！🌟📝
代码随想录-力扣刷题笔记
三月七꧁ ꧂: 我只能这样形容博主的文章：深入浅出诠真理，行云流水妙无痕。字里行间皆经典，赞叹之情溢心间。在这个充满数字代码和技术创新的世界中，我常常被那些隐藏在屏幕后的天才们所吸引，曾有幸目睹过博主的真容，那真是眉如远山含秋色，目似秋水映星辰。知海无边才女志，花容月貌俱佳音。
代码随想录——力扣刷题笔记之链表面试题
三月七꧁ ꧂: 施心技艺超群出，彤意表达妙绝伦。真知灼见展眼前，笨中求智得精髓。在这个数字化的时代，博主用自己的方式证明，技术与美，可以在一个人身上和谐共存。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。