推荐中的矩阵分解

最新推荐文章于 2022-04-01 20:39:07 发布

Rocket,Qian

最新推荐文章于 2022-04-01 20:39:07 发布

阅读量173

点赞数

分类专栏： # 推荐算法 ---推荐系统--- 文章标签：推荐算法矩阵分解 SVD

本文链接：https://blog.csdn.net/weixin_44127327/article/details/110089441

版权

推荐算法同时被 2 个专栏收录

17 篇文章 6 订阅

订阅专栏

---推荐系统---

12 篇文章 3 订阅

订阅专栏

矩阵分解

1.SVD 算法
2.ALS 算法
3.BPR算法

1.SVD 算法

1.1 矩阵分解

矩阵分解就是把原来的大矩阵，近似分解成两个小矩阵的乘积，在实际推荐计算时不再使用大矩阵，而是使用分解得到的两个小矩阵。

比如用户物品评分矩阵是 $m\times n$ ,可以选取一个很小的数，分解得到两个矩阵 $P$ 和 $Q$ ， $P$ 的维度是 $m\times k$ ， $Q$ 的维度是 $n\times k$ ,那这样：
$KaTeX parse error: Expected 'EOF', got '}' at position 30: …Q_{n\times k}^T}̲ = R_{m\times …$

1.2 基础SVD算法

从物理层面解释，矩阵分解是把用户和物品都映射到一个K维空间上，这个k维空间不是我们直接看到的，也不一定具有很好的解释型，每一个维度也没有名字，所以常被称为隐因子，代表藏在矩阵数据下面的规律。分解后矩阵 $P$ 的行向量就是用户的隐因子向量， $Q^T$ 的列向量就是物品的隐因子向量。

用户 $u$ 的向量是 $P_u$ ,物品 $i$ 的向量是 $q_i$ ，那么要计算物品 $i$ 推荐给用户 $u$ 的推荐分数，直接计算点积即可：
$r_{ui}=p_uq_i^T$
这个难点在于如何得到每一个用户、每一个物品的 $k$ 维向量。这是一个机器学习问题。应用机器学习框架时，一般要考虑：

损失函数
优化算法

SVD算法的损失函数：
$J=min\sum_{(u,i)\in k}(r_{ui}-p_uq_i^T)^2+\lambda(||q_i||^2+||p_u||^2)$
加号前面部分控制着模型的偏差，加号后的部分控制着模型的方差。前一部分用分解后的矩阵预测评分，预测结果和实际的用户评分之间误差越小越好。后面一部分得到的隐因子向量要越简单越好，以此控制模型的方差，即让它在真正执行推荐任务时要发挥稳定，对应ML中的过拟合。