【LLM 论文】Chain-of-Verification:通过验证链来减少 LLM 幻觉

论文:Chain-of-Verification Reduces Hallucination in Large Language Models

⭐⭐⭐

arXiv:2309.11495

论文速读

LLM 由于不可避免地会产生幻觉,现有的研究主要鼓励 LLM 在产生 response 之前生成内部思想的推理链,或者通过 self-critique 等技术来更新它们的初始 response。

本工作提出了 Chain-of-Verification(CoVe)的方法,示例如下:

image-20240510200249963

CoVe 主要执行四个核心步骤:

  1. Generate Baseline Response:给定一个 query,使用 LLM 生成一个 response
  2. Plan Verifications:基于原始的 query 和上一轮得到的原始 response,让 LLM 生成一个 verification question 列表,并用于帮助 LLM 进行自我分析
  3. Execute Verifications:依次回答每个 verification question,从而对照原始 response 检查是否存在不一致或错误
  4. Generate Final Verified Response:考虑前面步骤的结果,完成最终的修正后的 response

每一个步骤的执行都是通过 prompt 相同的 LLM 来实现的。其中 1、2、4 步骤使用了一个 single prompt 实现,3 步骤则复杂了一些,尝试了多种实现方式,具体可参考论文。

总结

验证链(CoVe)通过让 LLM 审议自身的 response 来自我纠正从而减少 LLM 的幻觉问题,特别是将验证过程分解为一组更加简单的问题,能够让模型相比于回答原始查询时能有更高的准确性,从而能够发现一些自身原始 response 可能存在的问题。

论文也指出,在第三个步骤“执行验证”中,使用 RAG 方法可能会进一步带来收益。
在第三个步骤“执行验证”中,使用 RAG 方法可能会进一步带来收益。

  • 24
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值