【RAG 论文】BGM：为 LLM 和 Retriever 的偏好 gap 搭建一个 Bridge

yubinCloud

已于 2024-05-13 22:29:37 修改

阅读量1.3k

点赞数 36

分类专栏： LLM Research 文章标签：深度学习人工智能自然语言处理 RAG

于 2024-05-13 22:29:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45668004/article/details/138822382

版权

论文：Bridging the Preference Gap between Retrievers and LLMs

⭐⭐⭐

Google Research, arXiv:2401.06954

论文速读

LLM 与 Retriever 之间存在一个 preference gap：大多数 retriever 被设计为 human-friendly，但是 LLM 的偏好与人类的却不一致：

ranking 方面：由于 LLM 的 self-attention 机制，模型可以集中任何 token 而无视其 position。但人类对于 position 还是很关注的。
selection 方面：人类可以轻易地忽视掉与上下文无关的信息，但 LLM 却对于无关内容特别敏感。
repetition 方面：人类往往不关心重复内容，甚至不喜欢重复内容，但是 repetition 却在对于 LLM 在衡量相关性的权重时很有帮助。

论文原文设计了一些实验来证明 preference gap 确实存在，具体可以参考原论文。

为了弥补 LLM 和 Retriever 之间的 preference gap，过去的研究工作往往是集中于对 LLM 或 Retriever 进行微调，但其实无论是 LLM 还是 Retriever 都很可能是无法微调的。

比如对于生产级的 Retriever，如 Googl

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。