UCSB:在多agent辩论中减少LLM幻觉

在这里插入图片描述

📖标题:DebUnc: Mitigating Hallucinations in Large Language Model Agent Communication with Uncertainty Estimations
🌐来源:arXiv, 2407.06426

🛎️文章简介

🔸研究问题:如何减轻大语言模型(LLM)的智能体在沟通中出现幻觉,进而误导其他代理的现象。
🔸主要贡献:论文提出了DebUnc框架,通过引入不确定性评估方法来减轻代理在沟通中出现的幻觉问题。

📝重点思路

🔺相关工作

🔸LLM不确定性:目前一些减轻幻觉的研究工作,侧重于测量模型的不确定性并增强其自我意识。
🔸多代理辩论:LLM作为智能体集成到更复杂的系统中,关键部分是协作机制,模型可以在其中相互辩论。

🔺论文方案

🔸目标:建议智能体根据其置信水平,优先考虑其他智能体的意见。
🔸运作:在每一轮辩论中,每个智能体都会生成一个响应,并估计不确定性。在下一轮中,每个智能体的响应和不确定性将与其他所有智能体共享。
🔸三种不确定性指标:平均令牌熵(Mean Token Entropy),平均令牌负对数概率加权(TokenSAR),预言机(Oracle)
🔸两种不确定性传达:将不确定性转为置信度引入下一轮辩论的文本提示,将不确定性引入注意力机制控制生成过程

🔎分析总结

🔸DebUnc框架在多个LLM、基准测试和不确定性度量中,显著优于未修改的辩论。
🔸调整注意力机制以基于自信度修改令牌权重的方法更为有效,表明信息可以通过传统文本提示之外的方法传达给LLM。

💡个人观点

论文提出了DebUnc框架,通过量化和传达LLM智能体的不确定性来增强多智能体辩论性能。

附录

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大模型任我行

随意啦,喜欢就好~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值