概率矩阵分解通俗易懂的理解

用来做什么

传统的协同过滤方法既不能处理大数据量的推荐,也不能处理只有很少评分的用户。概率矩阵分解通过用户-产品评分矩阵,可以学习到用户和产品的特征向量,进而得到完整推荐结果。

怎么做到的

概率矩阵分解简单而言就是:R矩阵(用户-产品评分矩阵)是本身已有推荐数据,矩阵稀疏,我们需要填补这些稀疏的部分作为推荐结果。此时我们假定R矩阵等于U、V的内积,U、V分别为用户特征矩阵和产品特征矩阵。U、V的内积得到的矩阵具有以下特性:
1、最大限度地满足:本身已有矩阵R,在不稀疏、有评分数据的位置上,与UV的内积对应位置评分数据相近。
2、在本身已有矩阵R的稀疏位置,UV的内积作为预测结果用来推荐。
此时可以根据条件1来计算U、V,再根据计算结果的U、V来填补R的稀疏部分,达成推荐。
3、以上两点是矩阵分解(MF)的特性,PMF相比与MF,引入了与概率、统计学相关的概念与方法,实际上与MF并无太大差异。

怎么计算的

核心思想:推荐系统用来学习的矩阵为R,其中Rij代表了用户i对物品j的评分。一般而言矩阵R是稀疏矩阵,有很多评分数据为0。此时通过引入用户特征矩阵和物品特征矩阵,使得R=UV(内积)。(涉及先验后验似然知识)。假设在U、V情况下,得到现有用户-物品矩阵R的概率服从正态分布,且假设U、V服从某一形式的正态分布。此时可以得到后验概率P(U,V|R)。需要通过得到的最大化目标函数,使后验概率最大,此时得到的U、V即为所求的特征矩阵。
根据U、V特征矩阵可以得到完整评分推荐矩阵。

推导过程

具体可以看知乎文章,这篇推导过程写的比较详细。
https://zhuanlan.zhihu.com/p/27399967
直到最后推导,得到PMF的最大化目标函数:
在这里插入图片描述
即目标为最小化(-E)。最小化(-E)可以分三个小目标看:
第一个目标:相当于RMSE,衡量已有评分R与计算评分UiTVj之间的差异。
在这里插入图片描述
第二、三个目标:相当于一个正则化目标。如果只最小化RMSE会造成过拟合,此时相当于加上了范数进行正则化。
在这里插入图片描述

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值