22-sigir-Optimizing generalized Gini indices for fairness in rankings

KY:fairness, ranking, recommender systems, welfare economics
AB:受经济学中不平等度量领域的启发,本文探讨了使用广义基尼福利函数(Generalized Gini welfare functions,GGF)作为一种手段来指定推荐系统应该优化的规范标准。GGF根据个人在人口中的排名对其进行加权,给予较差的个体更多的权重以促进平等。根据这些权重,GGF最小化项目暴露的基尼指数,以促进项目之间的平等,或者关注最不满意用户的特定分位数的表现。用于排名的GGF难以优化因为它们是不可微的。我们通过利用非光滑优化和可微排序中使用的投影算子(projection operators)中的工具来解决这个挑战。实验表明方法在各种推荐任务和公平标准上获得了比基线更好的权衡。

1 intro

GGF通过最大化个人效用的加权和来做决策的,这给那些效用较低的人更多的权重。通过优先考虑境况较差的人,GGF促进平等。

由于 GGF 包括了如 Gini inequality index,可以用来优化项目之间的曝光不平等和用户效用之间的权衡,这是许多作者寻求的目标【B32, F25】。GGF还可以方便地基于 utility quantiles 指定规范标准。此外,利用凸多目标优化技术,我们证明了 GGF 覆盖了所有满足洛伦兹效率的排序策略,洛伦兹效率是最近引入的双边公平分配公平准则。

将 GGF 作为排序公平性的目标函数的困难源于它们的不可微性。基于非光滑优的Frank-Wolfe算法的扩展,通常是优化平滑的代理目标函数,同时逐渐减平滑参数,而一种常用的平滑技术是 Moreau envelope。我们认为 GGF 的 Moreau envelope 的梯度可以在𝑂(𝑛log𝑛)计算出,𝑛是用户或项目的数量。这一结果解锁了 GGF 中 Frank-Wolfe 算法的使用,允许我们在优化 GGF 的同时有效地找到最优的排序策略。

我们展示了该算法在电影和音乐的两个推荐任务上的性能,以及一个互惠推荐问题(类似于约会平台,用户被推荐给其他用户)。与相关的基线相比我们的算法成功地在用户效用和项目曝光的不平等方面产生了更好的权衡。我们的方法还成功地发现了在双边公平方面更好的权衡,当最大化用户效用的较低分位数,同时最小化项目曝光的基尼指数。

6 RW

  1. 算法公平
    本文的双边与前人不同的是,多个目标是每个用户每个项目的单独效用,而我们的目标是通过重新分配效用来公平地对待每个实体。据我们所知,我们是第一个使用 GGF 作为用户和项目效用的福利函数,以实现排名中的双边公平性。
  2. 非光滑凸优化与可微排序
    我们的工作建立在非光滑凸优化方法[54,63]之上,特别是针对非光滑问题的 Frank-Wolfe 算法的变体。在我们的例子中,我们使用了Lan [44]的算法,它将Frank-Wolff应用于非光滑目标的Moreau envelope。我们的技术贡献也与可微排名的文献有关,最接近我们的方法是Blondel等人[10]的可微排序算子,它也依赖于 isotonic 回归。我们的方法之间的差异在 Remark 1 中有解释。

7 结论

我们提出了广义基尼福利函数作为一种灵活的方法来产生公平的排名。我们通过利用 Frank-Wolfe 方法来实现非平滑目标,解决优化这些福利函数的挑战,并证明了它们在排名应用中的效率。我们的框架和算法既适用于电影或音乐推荐,也适用于相互推荐场景。

GGF 函数成功地解决了排序算法的各种公平性要求。一方面,GGF 在减少不平等方面是有效的,因为它们推广了经济学中的基尼指数。优化它们可以满足平等效用标准的要求,这在很大程度上是由现有的关于公平推荐的工作所提倡的。另一方面,GGF 有效地增加了差者的效用,这在经济学中通常用分位数比来衡量,最近被认为是进行排名的公平标准[27]。

我们的方法仅限于在推理阶段的公平性考虑。它没有解决在推荐管道的其他部分产生的潜在偏差,例如在估计偏好方面。此外,我们考虑了一个静态模型,它没有考虑现实世界的动态,如双边市场的响应性 [68],学习过程中的反馈回路[11],以及用户和项目的种群 [51]和偏好[42]的变化性质。解决这些局限性,结合我们的方法,是未来研究的方向。

2 公平排序 with 广义Gini

2.1 推荐架构

like【B06】,我们考虑随机排名,因为能够使用凸优化技术来生成推荐,否则将涉及所有用户排名空间中一个棘手的组合优化问题。
用户𝑖的随机排序由双随机矩阵𝑃𝑖∈R𝑚×𝑚表示,其中𝑃𝑖𝑗𝑘是项目𝑗在𝑘位置推荐给用户𝑖的概率。推荐系统的排序策略𝑃。我们用 P \mathcal{P} P来表示排序策略的凸集。

用户utility:排序性能;项目utility:对用户的平均曝光;
在这里插入图片描述

排名策略𝑃是通过最大化一个全局福利函数 𝐹(𝑃) 来找到的,并且福利函数是针对用户和项目的福利函数的加权和:
在这里插入图片描述
关于 guser 和 gitem 具体怎么聚合效用,见 2.3 和 2.4 节原文。

2.2 GGF

关注基于 GGFs 的 guser 和 gitem 的例子。
(1)Relationship to the Gini index
(2)Multi-objective optimization of Lorenz curves

2.3 公平排序中的GGFs

先前提出的两种公平性评估协议,它们属于 GGF 的最大化范围。
(1)用户效用和项目曝光中的不平等之间的权衡;
(2)双边公平

2.4 生成所有的洛伦兹有效的解决方案

(1)Def 1:排序策略 P 是洛伦兹有效的 if …
(2)Additive welfare functions vs GGFs.

3 优化GGF(挑战、GGFs 的 Moreau envelope、Frank-Wolfe with smoothing)

优化 GGF 的挑战是它们是不可微的,因为它们需要排序效用。我们首先描述为什么现有的优化 GGF 的方法不适合排序问题(3.1),然后,我们展示了如何有效地计算 GGF 的 Moreau envelope 的梯度【大概就是 Moreau envelope 给出了平滑的近似,并且能通过参数控制平滑度和近似质量的权衡。然后给出梯度的具体计算】(3.2),给出了完整的算法【最小化 𝑓 的算法 FW-smoothing 】(3.3)。

4 实验(实验设置、结果、收敛诊断)

数据:Lastfm-2k、ML20M
评估:参考【B35】
先利用 MF 算法补全偏好矩阵,从偏好中得到排名,曝光权重 b 由 DCG 计算。

5 互惠推荐(该框架和算法的扩展、实验)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值