【Article】Detecting hallucinations in large language models using semantic entropy

猛码Memmat

已于 2024-07-08 12:01:56 修改

阅读量59

点赞数 1

分类专栏： Memmat 文章标签：语言模型人工智能自然语言处理深度学习论文

于 2024-07-07 23:10:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JishuFengyang/article/details/140253978

版权

Memmat 专栏收录该内容

37 篇文章 2 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

文章目录

1. Abstract
2. Main
3. Online content
4. Methods
5. Data availability
6. Code availability
Reference
Easter Egg：mum

【Nature Article】Detecting hallucinations in large language models using semantic entropy

论文记录。翻译不准确，以原文为准。代码解析敬请期待。

1. Abstract

大型语言模型(LLM)系统，如ChatGPT或Gemini?，可以表现出令人印象深刻的推理和回答问题的能力，但经常会产生“幻觉”的错误输出和未经证实的答案。不可靠的回答或没有必要的信息阻碍了在不同领域的采用，问题包括在新闻文章中捏造法律先例或不真实的事实，甚至对放射学等医学领域的人类生命构成威胁。通过监督或强化鼓励诚实只取得了部分成功。研究人员需要一种检测法学硕士幻觉的通用方法，这种方法甚至适用于人类可能不知道答案的新问题和未知问题。在这里，我们开发了基于统计学的新方法，为法学硕士提出了基于熵的不确定性估计器，以检测幻觉的子集-虚构-这是任意和不正确的世代。我们的方法解决了这样一个事实，即一个想法可以通过计算意义层面的不确定性而不是特定的单词序列来以多种方式表达。我们的方法可以跨数据集和任务工作，而不需要任务的先验知识，不需要特定于任务的数据，并且可以健壮地推广到以前未见过的新任务。通过检测提示何时可能产生错误，我们的方法可以帮助用户了解何时必须格外小心使用llm，

了解本专栏

超级会员免费看

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
6
评论
【Article】Detecting hallucinations in large language models using semantic entropy

hallucination
复制链接

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

猛码Memmat 欢迎支持，随缘打赏 ~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。