一直以来,推荐系统预测用户对物品的喜好程度,然后将预计用户最喜欢的前N个物品推荐给它,以实现个性化推荐。可以看到,这其实可以当成一个rank问题:将用户喜欢的物品排序,然后推荐前N个它最喜欢的。虽然如此,之前的model-based CF(如Matrix factorization, FM)和memory-based CF(如K-Nearest-Neighbor, KNN)都不是直接为排序而优化的。
相反,Web搜索引擎一直使用learning to rank的方法给文档排序。所谓learning to rank就是使用机器学习的方法习得一种自动排序的方法。常用来衡量排序性能的指标有:NDCG(Normalized Cumulative Discounted Gain),MRR(Mean Reciprocal Rank),ERR(Expected Reciprocal Rank)等。不过[26]指出,信息检索中的measures都是不连续的——所谓不连续就是如果一个物品的评分(排名)变化,那么整个推荐的utility不是连续变化的。因此很多基于梯度下降的机器学习方法无法直接优化这些measures。于是,learning to rank优化其他的目标函数。主要分成3类(可以看到,这三种方法,从上到下样本空间是依次增大的):
①Point-wise:分别优化单个物品的cost,而不考虑物品将的顺序。其实这个便退化成预测usage准确率的问题了。但是[27]指出point-wise方法被证明在Web s
相反,Web搜索引擎一直使用learning to rank的方法给文档排序。所谓learning to rank就是使用机器学习的方法习得一种自动排序的方法。常用来衡量排序性能的指标有:NDCG(Normalized Cumulative Discounted Gain),MRR(Mean Reciprocal Rank),ERR(Expected Reciprocal Rank)等。不过[26]指出,信息检索中的measures都是不连续的——所谓不连续就是如果一个物品的评分(排名)变化,那么整个推荐的utility不是连续变化的。因此很多基于梯度下降的机器学习方法无法直接优化这些measures。于是,learning to rank优化其他的目标函数。主要分成3类(可以看到,这三种方法,从上到下样本空间是依次增大的):
①Point-wise:分别优化单个物品的cost,而不考虑物品将的顺序。其实这个便退化成预测usage准确率的问题了。但是[27]指出point-wise方法被证明在Web s