论文解读——Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model

论文解读——Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model

简介

本文是Koren在KDD08会议的文章,其核心思想主要是

  1. CF中的邻域模型和隐因子模型可以进行融合,得到更好的效果
  2. 隐性反馈可以被引入模型之中,达到更好的效果

主要内容

1 协同过滤CF不需要领域知识、不需要收集大量数据,并能发现一些复杂和意料之外的模型的优势,使其十分流行。

2 CF主要包括领域模型和隐因子模型,两者各有优缺点。领域模型由于重点关注最近的邻居,因而擅长于发现局部关系,但是难以捕捉数据集中全部的弱信号,而隐因子模型则能有效估计出大部分项目或所有项目的整体结构,但是不能发现一小部分项目间的强关联。

3 包括购买历史、浏览历史、搜索历史,甚至是鼠标移动,都可以用作隐性反馈加入到模型中。

4 模型方面,作者首先提出了Baseline算法,然后开始分领域模型和隐因子模型进行介绍。

5 邻域模型方面,作者首先介绍了和论文解读——Performance of Recommender Algorithms on Top-N Recommendation Tasks中一样的领域模型,该模型是基于领域思想的经典表达,只能直接根据数据进行计算,无法进行调整,同时没有考虑所有邻居,且当用户的评分很少时会失去作用,于是作者使用了一个插值因子 θ i j u \theta_{ij}^u θiju来解决这一问题,于是模型变成了
r ^ u i = b u i + ∑ j ∈ S k ( i ; u ) θ i j u ( r u j − b u j ) \hat r_{ui}=b_{ui}+ \sum_{j\in S^k(i;u)}\theta_{ij}^u(r_{uj}-b_{uj}) r^ui=bui+jSk(i;u)θiju(rujbuj),该模型详见。
在此模型上,再加入用户的隐式反馈便是作者在文中提出的领域模型,该模型可以使用优化模型或者最小二乘进行计算。

6 在隐因子模型方面,首先提出了Asymmetric-SVD即非对称SVD,非对称体现在使用项目特征来表示用户特征,
r ^ u i = b u i + q i T ( ∣ R ( u ) ∣ − 1 2 ∑ j ∈ R ( u ) ( r u j − b u j ) x j + ∣ N ( u ) ∣ − 1 2 ∑ j ∈ N ( u ) y j ) \hat{r}_{ui} = b_{ui} + q_i^T\left(\vert R(u) \vert ^{-\frac{1}{2}}\sum_{j\in R(u)}(r_{uj}-b_{uj})x_j+\vert N(u) \vert^{-\frac{1}{2}}\sum_{j\in N(u)}y_j\right) r^ui=bui+qiTR(u)21jR(u)(rujbuj)xj+N(u)21jN(u)yj
常见的P向量被一些项目特征进行表示,故称为非对称,该模型的优点在于更少的参数(不需要训练P矩阵了)、不涉及到用户偏好故可以对新用户新用户推荐、可解释性(通过项目进行解释)和有效使用了隐性反馈。
后面加进了常见的P,那就是SVD++了,可以参考另一篇博文推荐系统surprise库教程

7 作者将两个模型进行了融合,就是后两个评分预测公式融合了一下。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
因子分解遇见邻域:一个多方面的协同过滤方法是一种结合了因子分解和邻域方法的协同过滤算法。在传统的协同过滤算法中,主要有两种方法:基于邻域的方法和基于模型的方法。基于邻域的方法主要是通过计算用户间或物品间的相似度来推荐相似用户或相似物品的评分。而基于模型的方法则是通过构建模型来预测评分。 因子分解是一种常见的基于模型的方法,它可以将用户-物品评分矩阵分解为两个低秩矩阵的乘积,以得到用户和物品的隐含特征。这种方法可以有效地处理稀疏性和冷启动的问题,但在数据稀疏的情况下仍然存在一些挑战。 为了克服因子分解算法在数据稀疏情况下的问题,多方面的协同过滤算法提出了将因子分解与邻域方法相结合的新思路。具体而言,它利用了邻域方法的局部信息来改进因子分解算法的准确度和鲁棒性。 在多方面的协同过滤算法中,首先通过因子分解算法得到用户和物品的隐含特征,并用隐含特征对评分进行预测。然后,利用邻域方法计算用户或物品的邻居,并根据邻居的评分信息进行调整。最终,通过加权融合因子分解和邻域方法的结果,得到最终的推荐结果。 该算法的优点是综合了因子分解和邻域方法的优势,可以克服两种方法在特定情况下的局限性。它既考虑了全局的隐含特征,又考虑了局部的用户或物品相似度。因此,多方面的协同过滤算法在推荐系统中具有广泛的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值