直接优化物品排序的推荐算法

本文探讨了如何将Learning to Rank应用于推荐系统,重点介绍了两种模型:Bayesian Personalized Ranking (BPR) 和 Collaborative Less-is-More Filtering (CLiMF)。BPR通过优化pair-wise目标实现个性化排序,而CLiMF则针对列表前面错序问题,优化平均倒数位置(MRR)。实验表明,BPR在不同数据集上的表现因领域差异而异,而CLiMF旨在提高相关物品的排名并分散展示。
摘要由CSDN通过智能技术生成
一直以来,推荐系统预测用户对物品的喜好程度,然后将预计用户最喜欢的前N个物品推荐给它,以实现个性化推荐。可以看到,这其实可以当成一个rank问题:将用户喜欢的物品排序,然后推荐前N个它最喜欢的。虽然如此,之前的model-based CF(如Matrix factorization, FM)和memory-based CF(如K-Nearest-Neighbor, KNN)都不是直接为排序而优化的。

相反,Web搜索引擎一直使用learning to rank的方法给文档排序。所谓learning to rank就是使用机器学习的方法习得一种自动排序的方法。常用来衡量排序性能的指标有:NDCG(Normalized Cumulative Discounted Gain),MRR(Mean Reciprocal Rank),ERR(Expected Reciprocal Rank)等。不过[26]指出,信息检索中的measures都是不连续的——所谓不连续就是如果一个物品的评分(排名)变化,那么整个推荐的utility不是连续变化的。因此很多基于梯度下降的机器学习方法无法直接优化这些measures。于是,learning to rank优化其他的目标函数。主要分成3类(可以看到,这三种方法,从上到下样本空间是依次增大的):

   ①Point-wise:分别优化单个物品的cost,而不考虑物品将的顺序。其实这个便退化成预测usage准确率的问题了。但是[27]指出point-wise方法被证明在Web s
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值