CMU：在RAG系统中实现公平排名

大模型任我行

于 2024-09-29 08:00:00 发布

阅读量302

点赞数

分类专栏：大模型-RAG 大模型-模型评估文章标签：人工智能自然语言处理语言模型论文笔记

本文链接：https://blog.csdn.net/weixin_46739757/article/details/142596183

版权

大模型-模型评估同时被 2 个专栏收录

34 篇文章 0 订阅

订阅专栏

大模型-RAG

28 篇文章 0 订阅

订阅专栏

在这里插入图片描述

📖标题：Towards Fair RAG: On the Impact of Fair Ranking in Retrieval-Augmented Generation
🌐来源：arXiv, 2409.11598

摘要

🔸目前许多语言模型都加强了检索能力，从而普遍采用了检索增强生成（RAG）系统。然而，尽管检索是RAG的核心组成部分，但该领域的许多研究忽视了公平排名的广泛研究成果，忽略了考虑所有利益相关者的重要性。
🔸本文提出了第一个系统评估与公平排名集成的RAG系统。我们特别关注于测量RAG系统使用的排名中每个相关项目的公平曝光度（即项目方公平），旨在促进相关项目提供者的公平增长。为了深入了解RAG环境下项目公平性、排名质量和生成质量之间的关系，我们分析了九种不同的RAG系统，这些系统在七个不同的数据集上集成了公平排名。
🔸我们的研究结果表明，具有公平排名的RAG系统可以保持高水平的生成质量，并且在许多情况下，甚至可以胜过传统的RAG系统，尽管在确保公平和维护系统有效性之间存在一般的权衡趋势。我们相信我们的研究成果为负责任和公平的RAG系统奠定了基础，并为未来的研究开辟了新的途径。我们在https://github.com/kimdanny/Fair-RAG上公开发布了我们的代码库和数据集。

🛎️文章简介

🔸研究问题：在检索增强生成（RAG）模型中，如何评估和提升排序的公平性？
🔸主要贡献：论文通过引入随机排名器来增强RAG系统中的个体项目公平性，并评估了不同检索公平性水平对排名质量和生成质量的影响。

📝重点思路

🔺相关工作

🔸RAG：是一种特定类型的检索增强机器学习(REML)，已广泛应用于语言建模、问答、个性化和推荐，评估主要集中在其有效性，很少关注公平性。
🔸排名公平：通过基于规范问题的各种定义来实现，包括个人公平和群体公平。

🔺论文方案

🔸使用随机排名器（stochastic ranker）来替代传统的确定性排名器（deterministic ranker），以确保在多次用户请求中，相似项目能够获得相似的预期曝光。
🔸通过Plackett-Luce采样方法来实现随机排名，从而在期望中实现公平排名。
🔸定义并使用公平性指标（如Expected Exposure, EE）和排名质量指标（如Expected Utility, EU），以评估采样排名的公平性和质量。
🔸通过实验评估RAG系统在不同任务中的表现，观察检索公平性对排名质量和生成质量的影响。