目录
Abstract
许多现有的协作过滤方法都不能处理 非常大的数据 ,也不容易处理 评分很少的用户。
在本文中,我们提出了 概率矩阵分解(PMF) 模型,该模型 与观测数据的数量成线性关系(为什么线性: 因为一个样本,梯度下降就更新一次参数),更重要的是,在大型、稀疏和非常不平衡的Netflix数据集上表现良好。
我们进一步扩展了PMF模型,以包括一个自适应的先验模型参数,并展示了如何自动控制模型容量。d4
最后,我们介绍了PMF模型的一个受限制的版本,该模型基于这样一个假设:对类似电影集进行评级的用户可能有类似的偏好。
此模型能够对评分很少的用户进行相当好的泛化性能。
当多个PMF模型的预测与预测受限玻尔兹曼机器模型 (怎么结合的:不同模型预测结果的线性组合),我们实现了一个错误率0.8861,比Netflix自己的评分高出近7%。
Introduction
最流行的协同过滤方法之一是基于低维因子的模型。这些模型背后的想法是,用户的态度或偏好是由少量未被观察到的因素。在线性因