本文介绍 ICML2020 中 4 篇与推荐系统相关的论文。分别为:
低通协同过滤推荐的图卷积网络
推荐系统中 Pap@k 度量的优化与分析
有序非负矩阵分解在推荐中的应用
推荐系统中的长期社会福利优化:一种约束匹配方法
1. Graph Convolutional Network for Recommendation with Low-pass Collaborative Filters
图卷积网络(GCN)广泛应用于推荐等图数据学习任务中。然而,当面对较大的图时,图卷积计算量很大,因此现有的 GCN 中都进行了简化,但由于过于简化而受到严重影响。为了弥补这一差距,这篇文章利用 GCN 中原有的图卷积,提出了一种低通协同过滤(LCF),使其适用于大型图。LCF 的设计消除了观测数据中曝光和量化带来的噪声,并无损地降低了图形卷积的复杂度。实验表明,LCF 提高了图卷积的有效性和效率,并且提出的 GCN 的性能明显优于现有的 GCN。您可以在 https://github.com/wenhui-yu/lcfn 上查看代码。
2. Optimization and Analysis of the pAp@k Metric for Recommender Systems
现代推荐和通知系统必须稳健地应对数据失衡、建议/通知数量限制以及用户之间的异类接触。Pap@k 度量结合了 partial-AUC 度量和 precision@k 度量,最近被提出用于评估上面所述的推荐系统,并已在实际部署中使用。从概念上讲,Pap@k 衡量正确的将排名靠前的正实例排在排名靠前的负实例前面的概率。由于排名靠前的点所呈现的组合特征,人们对 Pap@k 的特点和优化方法知之甚少,文章中分析了 Pap@k 的学习理论特性,特别是它在评价现代推荐系统中的优势,并提出了在一定的数据规则条件下保持一致的新的替代物。然后,文章提供了基于梯度下降的算法来直接优化替代物。文章的分析和实验评估表明,Pap@k 确实在 partial-AUC 和 precision@k 上表现出了一定的双重行为,而且在各种应用中,所提出的方法都优于所有的基线。综上所述,文章的结果推动了 Pap@k 在具有不同用户参与度的大规模推荐系统中的使用。
3. Ordinal Non-negative Matrix Factorization for Recommendation
这篇文章介绍了一种新的有序数据非负矩阵分解(NMF)方法,称为 OrdNMF. 有序数据是类别之间表现出自然排序的分类数据。具体地说,它们可以在具有显式数据(例如评级)或隐式数据(例如量化播放数量)的推荐系统中找到。OrdNMF 是一个概率潜在因子模型,它推广了伯努利—泊松分解(BePoF)和泊松分解(PF)在二值化数据上的应用。与这些方法相反,OrdNMF 避开了二进制化,可以利用更丰富的数据表示形式。文章设计了一种有效的变分算法,该算法基于合适的模型增广,并与变分 PF 相关。特别地,提出的算法保持了 PF 算法的可扩展性,可以应用于海量稀疏数据集。在显式和隐式数据集上的推荐实验表明 OrdNMF 在二值化数据上的性能优于 BePoF 和 PF.
4. Optimizing Long-term Social Welfare in Recommender Systems: A Constrained Matching Approach
大多数推荐系统(RS)研究假设用户的效用可以独立于其他代理(例如,其他用户、内容提供商)的效用而最大化。在现实环境中,这通常不是真的—— RS 生态系统的动态性耦合了所有代理的长期效用。这项工作将探讨内容提供商除非获得一定级别的用户参与,否则无法继续生存的设定。文章将这一背景下的推荐问题描述为诱导动力系统中的均衡选择问题,并证明了该问题可以作为一个最优约束匹配问题来求解。文中证明,即使在一个简单的、风格化的动态 RS 模型中,标准的短视推荐方法——总是将用户与最好的提供商相匹配——也表现不佳。文章中开发了几种可扩展的技术来解决匹配问题,并将其与用户遗憾和公平的各种概念联系起来,在实用意义上这些结果是更公平的。