嘿,记得给“机器学习与推荐算法”添加星标
题目: Adaptive Pointwise-Pairwise Learning-to-Rank for Content-based Personalized Recommendation
论文地址: https://dl.acm.org/doi/10.1145/3383313.3412229
代码: https://github.com/ygcinar/pointwise-pairwise-recommendation
1 Motivation
排序学习被广泛应用于信息检索、推荐系统和自然语言处理领域,典型的排序学习方法首先学习一个打分函数,然后通过这些分数再对物品进行排序。根据其损失的种类排序学习可以分为三类:pointwise,pairwise和listwise。这三种方法均有其优点和不足。尽管之前有不少工作在异构损失上下工夫[1,2],但是这些方法都是简单的将pointwise和pairwise损失结合起来,优化时采用联合或者交替优化。在这篇论文中,作者主要关注pointwise和pairwise方法,解决了这样一个研究问题:能否设计一种新的替代损失从而将这两种损失最佳并且自适应的结合起来?
2 Model
2.1 Pointwise Personalized Ranking from Implicit Feedback
Pointwise排序直接评估用户 对物品 的相关分数,将相关性估计作为一个分类问题(针对二分,用户给物品的打分为0/1)或是有序回归问题(针对多级分数,比如用户给物品的打分为1-5分)。其中 为打分函数, 为sigmoid函数, 为模型参数。
2.2 Pairwise Personalized Ranking from Implicit Feedback
Pairwise排序关注一对物品之间的相对顺序,以实现对这组物品的正确排序。
2.3 Proposed Framework
这部分是论文所提方法。Pairwise方法相比较于Pointwise方法对于标签不平衡较不敏感,对于标签噪声较敏感。而隐反馈数据本身就携带一些噪声,因为一些不相关的物品很有可能会被五点,而一些相关物品可能不会被用户点击到。因此作者提出一种学习策略,以便该模型可以针对每个三元组自行决定采用pointwise和pairwise方法中的哪一种。其中 为调整系数,当 时, 退化为 ,当 时, 退化为 。
2.4 Personalized Recommendation Ranking Model Details
2.4.1 User and Item Representations.
论文以使用隐反馈数据的个性化新闻推荐为场景。用户通过以下方式从其先前的交互(单击和未单击的项目)得到其特征表示:
其中 为物品 的嵌入, 为用户 在 时刻点击过的物品嵌入的平均, 为用户 在 时刻未点击过的物品嵌入的平均, 为参数, 为element-wise product。
2.4.2 Relevance Scoring Function.
利用简单的双线性形式计算出用户 对物品 的相关性得分: ,其中 为对角权重矩阵。
2.4.3 Adaptive Mixing Function.
其中 为对角权重矩阵, 为对应的minibatch。
3 Experiments
3.1 Datasets
1、INR
2、Outbrain
3.2 Experimental Setup
将数据集按照时间顺序划分为训练集、验证集和测试集。其余具体实验设置详情请见原文。
3.3 Results
通过表1可知,论文所提方法不仅极大的优于单独的pointwise、pairwise和listwise方法,同时还优于组合的pointwise-pairwise方法。
参考文献
[1] Yu et al. 2017. Alternating Pointwise-Pairwise Learning for Personalized Item Ranking. CIKM ’17.
[2] Wang et al. 2016. PPP: Joint Pointwise and Pairwise Image Label Prediction. CVPR '16.
推荐阅读
说个正事哈
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方“机器学习与推荐算法”,进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
喜欢的话点个在看吧????