【推荐系统】前深度学习时代推荐算法（2）：矩阵分解（MF）

济南卢卡库

已于 2024-12-10 16:46:34 修改

阅读量2.3k

点赞数 54

分类专栏：推荐系统文章标签：推荐算法算法矩阵 python 人工智能

于 2024-11-17 16:09:51 首次发布

本文链接：https://blog.csdn.net/qq_58872188/article/details/143825306

版权

3 篇文章

订阅专栏

回顾一下协同过滤

矩阵分解可以被视为一种 改进版的协同过滤。也可以说是协同过滤的一种 优化方法。

如果你想学习矩阵分解但还没学习过协同过滤，建议可以先了解一下协同过滤算法哦😊：

协同过滤存在问题：数据稀疏性

矩阵分解含义：将记录用户和物品交互信息的共现矩阵分解成一个用户矩阵和一个物品矩阵，从而使得数据可以以一种低维的方式表示。（ m*n 规模的矩阵分解为 m*k 和 k*n 的两个矩阵，其中k值就是后面我们会提及的隐向量的维度）

（可能你现在会很疑惑为什么要分解矩阵，继续往后看😊）

🌟核心思想：通过将原始矩阵拆分为若干个低秩矩阵来捕捉数据中的潜在关系（即用户和物品之间的潜在特征），并利用这些低维的表示来计算补全缺失值，进而进行个性化推荐。

（💡：所以矩阵分解的过程其实可以理解为对用户和物品的特征进行一个信息浓缩概括的过程）

隐向量：蕴含了用户或物品信息。上图中的用户矩阵的每一行和物品矩阵中的每一列就对应着一个用户或物品的隐向量。

隐向量的维度k：决定了其表达信息能力的大小。k的取值需要经过多次试验找到一个平衡点。（k越大，表达信息能力越强，泛化能力越弱）（上图中用户隐向量维度和物品隐向量维度都为2）

🌟算法流程（前三步与协同过滤无异）：

构建用户与物品的有向图（有向图的弧表示用户对物品的互动记录）
根据有向图构建共现矩阵（横列坐标分别表示用户和物品）
问题转变为预测共现矩阵中空缺值的问题
填充空缺值，使得共现矩阵变成一个完整的矩阵，为后续的矩阵分解做准备。（最简单可以用用户和物品的平均评分或行为频率进行填充）
通过矩阵分解技术将共现矩阵矩阵分解为 用户矩阵 和 物品矩阵。矩阵存储了每个用户和物品的隐向量。主要利用梯度下降的方法，目标函数是使得原始共现矩阵与用户向量和物品向量之积的差尽量小。（理解：对用户和物品的特征信息浓缩概括的过程）
最后计算用户推荐列表仅需要将由前一步计算得出的用户矩阵与物品矩阵相乘，即可得出与原矩阵规模大小相同的矩阵，其中就预测各个物品的评价。（理解：利用前面浓缩概括的信息（用户矩阵和物品矩阵）进行推导的过程）

🤔那么有童鞋可能会问了：不是在第四步已经把矩阵填充完了吗，而我们的目标不就是预测空缺值吗，是不是任务到第四步已经结束了捏，为什么还要经过这么繁琐的步骤去矩阵分解？（要是能够分清，可以跳过这一部分啦🙂‍↔️）

💡这里需要说明一下：

填充的作用：填充缺失值的目的是为了使得矩阵不再稀疏，可以用来初始化矩阵分解的输入，使得算法有一个“完整”的数据集来进行训练。
矩阵分解的作用：矩阵分解在填充的基础上进一步提取出深层次的用户和物品之间的潜在关系，生成潜在因子矩阵，从而提升推荐的准确性。分解后得到的隐向量能够更好地拟合用户的兴趣和物品的特性，而不仅仅是填充值。