AAAI 2020｜SetRank: 一种针对推荐系统隐式反馈的贝叶斯协同排序算法

最新推荐文章于 2025-01-25 08:00:00 发布

「已注销」

最新推荐文章于 2025-01-25 08:00:00 发布

阅读量2.7k

点赞数 2

本文链接：https://blog.csdn.net/duxinshuxiaobian/article/details/105885245

版权

SetRank是一种针对推荐系统隐式反馈的贝叶斯协同排序算法，旨在解决传统pairwise和listwise方法在处理隐式反馈时的局限性。该方法通过最大化setwise偏好结构的后验概率，避免了独立性不一致问题，同时放宽了listwise方法中的排列限制。实验表明，SetRank在推荐效果上优于其他协同排序方法，证明了其在隐式反馈数据建模上的有效性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

你和“懂AI”之间，只差了一篇论文

很多读者给芯君后台留言，说看多了相对简单的AI科普和AI方法论，想看点有深度、有厚度、有眼界……以及重口味的专业论文。

为此，在多位AI领域的专家学者的帮助下，我们解读翻译了一组顶会论文。每一篇论文翻译校对完成，芯君和编辑部的老师们都会一起笑到崩溃，当然有的论文我们看得抱头痛哭。

同学们现在看不看得懂没关系，但芯君敢保证，你终有一天会因此爱上一个AI的新世界。

读芯术读者论文交流群，请加小编微信号：zhizhizhuji。等你。

这是读芯术解读的第149篇论文

AAAI 2020

SetRank:一种针对推荐系统隐式反馈的贝叶斯协同排序算法

SetRank: A Setwise Bayesian Approach for Collaborative Ranking

from Implicit Feedback

中国科学技术大学、百度

原文
Chao Wang, Hengshu Zhu, Chen Zhu, Chuan Qin, Hui Xiong, SetRank: A Setwise Bayesian Approach for Collaborative Ranking from Implicit Feedback, In Proceedings of the 34th AAAI Conference on Artificial Intelligence (AAAI 2020), New York, USA

本文是中国科学技术大学和百度TIC联合发表于AAAI2020的工作，文章提出一种新颖的针对推荐系统隐式反馈的贝叶斯协同排序算法SetRank。相比传统方法，SetRank能够更好地贴合推荐系统中隐式反馈的特点，以提供更好的排序结果。具体地，SetRank旨在最大程度地提高setwise偏好结构的后验概率，本文提供了矩阵分解和神经网络两种SetRank的实现方法。理论分析和实验结果都表明我们的方法可以有效地提高隐式反馈的推荐效果。

1.引言

推荐系统已广泛部署在许多流行的在线服务中，以增强用户体验和业务收入。作为个性化推荐的一项代表性任务，协同排序旨在根据用户从历史反馈中学到的偏好为用户提供备选物品的排名。用户反馈可以分为两种主要类型，一是显式反馈，二是隐式反馈。显式反馈指的是拥有明确的评分标准的数值反馈，例如豆瓣电影的五星制评分。与显式评分不同，隐式反馈仅包含正样本和未观测样本，而不是已分级的用户偏好。常见的隐式反馈包括点击记录，购买记录，点赞记录等等。在日常生活中，大多数用户的反馈都是隐式的，而非显式的。这为构建推荐系统带来了新的研究挑战，因为隐式反馈中并没有明确的未观测样本，而只有未观测样本。因此，近年来，基于隐式反馈的协同排序任务越来越引起人们的关注。

传统的协同排序方法以pairwise和listwise方法为代表，目前已有很多的相关研究工作，也取得了很好的实践效果，但这些方法仍然存在一些关键性的挑战。图1展示了不同的协同排序方法的大体思路。pairwise方法通常以一个正反馈物品和一个未观测物品组成的物品对作为基础，对隐式反馈中的偏好结构进行建模，这种做法容易出现假设与实现上的独立性不一致问题。例如，目前使用最广泛的pairwise方法中的贝叶斯个性化排序（BPR）方法试图最大化正反馈和未观测反馈之间的成对比较概率。这种处理要求严格假设两个物品具有独立的成对偏好，以此作为构建损失函数的基础。但是，如图1所示，如果用户1存在的偏好对A>B和C>D，则由于隐式反馈是0/1数值的，因此用户1也必须存在偏好对A>D和C>B。换句话说，在实际的偏好对构建过程中，我们有。因此偏好对之间的独立性无法保障，从而影响了pairwise损失函数的优化结果。一些后续的pairwise研究选择通过考虑用户和物品的组信息来放松独立性假设。例如，GBPR引入了更丰富的用户组信息，而Cofiset则定义了用户对物品组的偏好。但是，独立性不一致的问题仍然存在。

图1.不同协同排序方法对比

Listwise方法的做法是在物品列表上定义偏好大小的概率关系。对于listwise方法，关键的挑战是由于要用到整个列表的排列熟悉怒，如何有效地处理具有相同评级值的项目是很重要的，特别是因为隐式反馈中没有明确的分级评分，而是0/1评分，这时会有大量的物品评分相同，如何指定这些物品的排序顺序是一个难题。此外，listwise方法常通过计算交叉熵来计算观测和预测列表中排名靠前的P项物品之间的差异性，这将导致关于P的指数计算复杂度，这就是为什么许多listwise方法通常将P 设置为1的原因。

为了避免现有协同排序方法的局限性，在本文中，我们提出了一种新颖的setwise贝叶斯协同排序方法，我们称其为SetRank。SetRank可以更好地贴合推荐系统中隐式反馈的特征。例如，与成对方法相比，我们独立性假设更弱，就不会出现独立性不一致的问题。SetRank方法将将原始的评分记录转换为每个正样本与一组未观测样本之间的偏好比较，即每个用户相对于未观测到的物品集合，都更喜欢正反馈物品，如图1所示。此外，由于原始数据中不包含未观测到的物品之间的偏好比较，也不包含正样本物品之间的偏好比较，因此可以不对未观测物品集合或者正样本物品集合内部进行排序，这就放宽了listwise方式中的排列限制。因此，SetRank能够以更贴合实际场景的方式对隐式反馈的数据进行建模，同时避免了pairwise和listwise排序方法的弊端。在本文中，我们从理论估计和实验验证两方面验证了SetRank模型的效果。一方面，我们给出了SetRank方法的理论误差风险上确界，另一方面大量实验结果证明了SetRank能够超过目前最先进的一些协同排序方法。