TI:两阶段推荐系统中公平性的不确定性量化(以后再看)
KY:Two-Stage Recommender Systems, Distribution-Free Uncertainty Quantification, Algorithmic Fairness
AB:许多大型推荐系统包括两个阶段。第一阶段有效地筛选候选项目的一个小子集的完整项目池,第二阶段的模型从中筛选最终的推荐。在本文中,我们研究了如何确保对这种两阶段架构中的项目的群体公平性。特别是,我们发现现有的第一阶段的推荐者可能会选择一组不公平的候选人,这样第二阶段的推荐者就没有希望提供公平的推荐。
为此,在不确定性量化研究的推动下,我们提出了两种阈值策略选择规则,可以为第一阶段推荐者提供distribution-free和finite-sample的公平保证。更具体地说,给定任何queries和relevance model,以及每个阈值策略的相关项目的 预期数量的point-wise lower confidence bound,这两个规则从每组项目中找到包含足够的相关预期项目的near-optimal的候选集。
为了实例化这些规则,我们演示了如何从部分的和有偏的用户反馈数据中推导出这样的置信界限。此外,我们提供了有限样本(finite-sample)和渐近分析(asymptotic analyses)的两个阈值选择规则是如何接近最优阈值。除了这个理论分析之外,我们的经验表明,这两个规则可以一致地从每一组中选择足够的相关项目,同时在广泛的设置中最小化候选集的大小。
结论:在这项工作中,我们启动了在两阶段推荐系统的第一阶段的公平性的研究。特别地,我们提出了两种阈值-策略选择规则,它们可以使用大量可用的用户反馈数据来选择公平的第一阶段策略,并且在不同组之间具有不同的准确性,即使在第一阶段使用的相关性模型是有偏差的。结果表明,这两种选择规则可以以高概率从每一组中选择足够的相关预期项目,达到接近最优的候选集大小,并保持现有第一阶段推荐系统的效率。理论分析和empirical分析证明了提出的两个选择规则对用户反馈数据量、相关性模型的准确性和两个规则内的参数都具有鲁棒性。
目录
1 intro
2 RW
3 第一阶段的公平
4 公平和near-optimal的阈值选择规则
- 4.1阈值选择
- 4.2 Finite-Sample Near-Optimality Gap
- 4.3 来自用户反馈的置信界限
- 4.4 Asymptotic Near-Optimality Analysi
5 empirical 评估
- 5.1 实验设置
- 5.2 不同的方法如何随着用户反馈数据的大小而扩展(scale)?
- 5.3 relevance model的准确性如何影响不同的项目组?
- 5.4 这两种规则对clipping参数 𝜆 的鲁棒性有多强?
- 5.5 这两种规则对最大阈值𝑡_𝑔^max是否鲁棒?
6 结论