SVD++推荐系统

最新推荐文章于 2022-03-17 00:27:23 发布

turing365

最新推荐文章于 2022-03-17 00:27:23 发布

阅读量1.2w

点赞数 6

分类专栏：数据挖掘推荐系统文章标签：大数据数据挖掘推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/turing365/article/details/80544594

版权

本文介绍了SVD++推荐系统的工作原理，包括矩阵分解、LFM模型、损失函数、随机梯度下降法及其优化。文章还讨论了模型的改进，如考虑用户和物品的固有属性，以及邻域影响，最后分析了关键代码实现。

摘要由CSDN通过智能技术生成

- 原理
- 关键部分代码分析

原理

我们把用户的评分行为表示成一个评分矩阵 $R$ ，其中 $R[u][i]$ 就是用户 $u$ 对物品 $i$ 的评分。但用户不会对所有的物品评分，所以这个矩阵里有很多元素都是空的

因此，评分预测从某种意义上说就是对这些元素填空，如果一个用户对一个物品没有评过分，那么推荐系统就要预测这个用户是否是否会对这个物品评分以及会评几分。

所以我们需要寻找一种对矩阵扰动小的补全矩阵的方法。一般认为，如果补全后矩阵的特征值和补全之前矩阵的特征值相差不大，就算是扰动比较小。所以，早期的矩阵分解模型就是从数学上的SVD（奇异值分解）开始的。但奇异值分解由于计算复杂度很高，所以很难在实际系统上有所应用。

在多次探索之后，我们选择了Simon Funk提出的的SVD分解法（该方法简称为LFM）。其原理简要如下：

从矩阵分解的角度说，如果我们将评分矩阵 $R$ 分解为两个低维矩阵相乘：

\hat{R} = P^{T} Q

$\hat R=P^TQ$

其中 $P \in R^{f*m}$ , $Q \in R^{f*n}$ 是两个降维后的矩阵。则对用户 $u$ 对物品 $i$ 的评价预测值 $\hat R(u,i)=\hat r_{ui}$ ，可通过以下公式计算：

r^u i = \sum f p u f q t f

$\hat r_{ui}=\sum_f p_{uf}q_{tf}$
其中

puf=P(u,f) p u f = P ( u , f ) $p_{uf}=P(u,f)$ ,

qif=Q(i,f) q i f = Q ( i , f ) $q_{if}=Q(i,f)$ ,则：可以直接通过训练集中的观察值利用小化RMSE学习

P P $P$ 、

Q

$Q$ 矩阵。

既然我用RMSE作为评测指标，那么如果能找到合适的 $P$ 、 $Q$ 来小化训练集的预测误差，那么应该也能小化测试集的预测误差。因此，我们定义损失函数为：

C (p, q) = \sum (u, i) \in T r a i n (r u i - r^u i) 2 = \sum (u, i) \in T

最低0.47元/天解锁文章

关注

6
点赞
踩
60

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。