UCSB：在多agent辩论中减少LLM幻觉

最新推荐文章于 2024-09-29 22:27:37 发布

大模型任我行

最新推荐文章于 2024-09-29 22:27:37 发布

阅读量338

点赞数 7

分类专栏：大模型-Agent 文章标签：人工智能自然语言处理语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46739757/article/details/141460022

版权

大模型-Agent 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

在这里插入图片描述

📖标题：DebUnc: Mitigating Hallucinations in Large Language Model Agent Communication with Uncertainty Estimations
🌐来源：arXiv, 2407.06426

🛎️文章简介

🔸研究问题：如何减轻大语言模型（LLM）的智能体在沟通中出现幻觉，进而误导其他代理的现象。
🔸主要贡献：论文提出了DebUnc框架，通过引入不确定性评估方法来减轻代理在沟通中出现的幻觉问题。

📝重点思路

🔺相关工作

🔸LLM不确定性：目前一些减轻幻觉的研究工作，侧重于测量模型的不确定性并增强其自我意识。
🔸多代理辩论：LLM作为智能体集成到更复杂的系统中，关键部分是协作机制，模型可以在其中相互辩论。

🔺论文方案

🔸目标：建议智能体根据其置信水平，优先考虑其他智能体的意见。
🔸运作：在每一轮辩论中，每个智能体都会生成一个响应，并估计不确定性。在下一轮中，每个智能体的响应和不确定性将与其他所有智能体共享。
🔸三种不确定性指标：平均令牌熵（Mean Token Entropy），平均令牌负对数概率加权（TokenSAR），预言机（Oracle）
🔸两种不确定性传达：将不确定性转为置信度引入下一轮辩论的文本提示，将不确定性引入注意力机制控制生成过程

🔎分析总结

🔸DebUnc框架在多个LLM、基准测试和不确定性度量中，显著优于未修改的辩论。
🔸调整注意力机制以基于自信度修改令牌权重的方法更为有效，表明信息可以通过传统文本提示之外的方法传达给LLM。

💡个人观点

论文提出了DebUnc框架，通过量化和传达LLM智能体的不确定性来增强多智能体辩论性能。

附录

在这里插入图片描述

大模型任我行

关注

7
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大模型任我行 随意啦，喜欢就好~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。