Ask Large Language Models Not to Give Off-Topic Answers in Open Domain Multi-Hop Question Answering

UnknownBody

于 2024-06-02 10:51:32 发布

阅读量44

点赞数

分类专栏： LLM Daily LLM for NLP 文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/139388250

版权

LLM Daily 同时被 2 个专栏收录

218 篇文章 5 订阅 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

31 篇文章 0 订阅

订阅专栏

本文关注大型语言模型（LLM）在开放域多跳问答（ODMHQA）中生成偏离主题答案的问题。提出Dr3机制，通过鉴别、校正和反向推理链，有效减少离题答案，提高精确匹配性能。

摘要由CSDN通过智能技术生成

本文是LLM系列文章，针对《Dr3: Ask Large Language Models Not to Give Off-Topic Answers in
Open Domain Multi

Dr3：要求大型语言模型在开放域多跳问答中不要给出脱离主题的答案

摘要
1 引言
2 前言
3 方法
4 实验
5 结果与分析
6 相关工作
7 结论

摘要

开放域多跳问答（ODMHQA）在自然语言处理（NLP）中发挥着至关重要的作用，其目的是通过对外部知识源中检索到的信息进行多步骤推理来回答复杂的问题。最近，大型语言模型（LLM）由于其包括规划、推理和利用工具在内的能力，在解决ODMHQA方面表现出了显著的性能。然而，LLM在试图解决ODMHQA时可能会生成偏离主题的答案，即生成的答案与原始问题无关。这一问题的离题答案约占错误答案的三分之一，尽管意义重大，但仍未得到充分挖掘。为了缓解这个问题，我们提出了判别→重新组合→重新求解→重新分解（Dr3）机制。具体来说，鉴别器利用LLM的内在能力来判断生成的答案是否偏离主题。在检测到偏离主题的答案的情况下，校正器沿着相反的推理链（重新组合→重新求解→重新分解）执行逐步修正，直到最终答案成为主题。在HotpotQA和2WikiMultiHopQA数据集上的实验结果表明，与没有Dr3机制的基线方法相比，我们的Dr3机制大大减少了ODMHQA中偏离主题答案的发生率近13%，将精确匹配（EM）的性能提高了近3%。

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。