亚马逊：多agent交互量化LLM不确定性

大模型任我行

于 2024-12-30 08:00:00 发布

阅读量974

点赞数 27

分类专栏：大模型-推理优化大模型-Agent 文章标签：人工智能自然语言处理语言模型论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46739757/article/details/144768432

版权

在这里插入图片描述

📖标题：DiverseAgentEntropy: Quantifying Black-Box LLM Uncertainty through Diverse Perspectives and Multi-Agent Interaction
🌐来源：arXiv, 2412.09572

🌟摘要

🔸量化大型语言模型（LLM）的事实参数知识中的不确定性，特别是在黑盒设置中，是一个重大的挑战。现有的方法通过评估对原始查询的响应中的自一致性来衡量模型的不确定性，并不总是能捕捉到真正的不确定性。模型可能会以错误的答案对原始查询做出一致的响应，但对同一查询的不同角度的不同问题做出正确的响应，反之亦然。
🔸在这篇论文中，我们提出了一种新的方法，DIVERSEAGENTENTROPY，用于使用多智能体交互来评估模型的不确定性，假设如果模型是确定的，它应该在关于同一原始查询的不同问题集合中一致地回忆原始查询的答案。我们进一步实施弃权政策，在不确定性很高时拒绝回应。
🔸我们的方法可以更准确地预测模型的可靠性，并进一步检测幻觉，优于其他基于自洽性的方法。此外，它还表明，即使知道正确答案，现有模型在各种不同的问题下也往往无法一致地检索到同一查询的正确答案。

🛎️文章简介

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大模型任我行 随意啦，喜欢就好~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。