Top-K推荐中的自适应概率度量学习

AITIME论道

于 2020-10-14 17:37:51 发布

阅读量556

点赞数

文章标签：算法大数据编程语言 python 机器学习

本文链接：https://blog.csdn.net/AITIME_HY/article/details/109089199

版权

摘要：随着互联网内容和服务地迅速增长，用户发掘感兴趣产品的难度也日益增长。因此，个性化推荐系统发挥着越来越重要的作用。尽管矩阵分解和基于深度学习的方法已被证明能有效地对用户偏好进行建模，但它们的偏好度量方式违反了三角不等性因而无法捕获更细粒度的偏好信息。为了解决这个问题，我们提出了一个基于距离度量的推荐模型，该模型具有几个有趣的方面：(i) 每个用户和物品都通过高斯分布进行参数化以捕获学习过程中的不确定性；(ii) 提出了一种自适应间隔生成方案，用来根据不同训练三元组生成不同大小的间隔；(iii) 在目标函数中加入了显式的用户-用户/物品-物品相似性建模。我们将Wasserstein距离用于偏好打分，因为它服从三角形不等性并且可以测量概率分布之间的距离。通过使用五个真实的数据集和同类的方法比较，在Top-K推荐的召回率方面，我们提出的模型比现有的最佳模型好4-22％。

马辰，加拿大麦吉尔大学（McGill University）计算机系五年级博士生，导师为Xue Liu教授，研究方向为数据挖掘与推荐系统。

论文地址：

https://dl.acm.org/doi/10.1145/3394486.3403147

一、背景

随着互联网服务增长，用户可以获得更多的在线商品或者内容，这些用户和物品交互的数据就促成了一个新的服务，即个性化推荐服务。越来越多的互联网公司开发了针对用户的推荐服务，例如奈飞会根据用户的观影历史推荐不同类型的新作品。据统计表明奈飞有超过70%的数据是由推荐系统得到的。同样的例子在Quora上也是一样的，系统根据我们的浏览历史或提问历史推荐我们可能感兴趣的回答，可见这样一种服务已经广泛存在于我们的生活当中。

通常这样的推荐问题会被制作成基于用户-物品的打分矩阵，即使其成为一个矩阵填补问题。根据矩阵中能够收集到的用户打分基本数据，作者希望通过这些数据判断用户在那些没有打分的物品上的喜好是怎样的。因此在这篇论文里面所研究的问题是：基于对用户收集到的喜好，希望对用户推荐一些没有看过，但可能是潜在感兴趣的新物品。比如模型会对用户推荐10个或者20个物品，然后看有多少是真正符合用户喜好的，然后去计算推荐效果。

为了解决这个问题，有两种现在比较流行的解决方式，第一种叫Point-wise，第二种叫Pair-wise。第一种比较关注矩阵中物品的打分值的大小，其预测值是二进制的，例如在打分的时候用户1、电影3的打分要尽量接近于1，作为用户看过电影。第二种方式不关心打分值的绝对大小，而是用户打分的相

最低0.47元/天解锁文章

AITIME论道

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Top-K推荐中的自适应概率度量学习

摘要：随着互联网内容和服务地迅速增长，用户发掘感兴趣产品的难度也日益增长。因此，个性化推荐系统发挥着越来越重要的作用。尽管矩阵分解和基于深度学习的方法已被证明能有效地对用户偏好进行建模，...
复制链接

扫一扫