矩阵分解模型（1）：ALS学习算法

最新推荐文章于 2025-03-28 15:13:16 发布

oucpowerman

最新推荐文章于 2025-03-28 15:13:16 发布

阅读量3.2w

点赞数 11

分类专栏：推荐系统

本文链接：https://blog.csdn.net/oucpowerman/article/details/49847979

版权

本文介绍了矩阵分解模型在推荐系统中的应用，通过评分矩阵A的低秩假设，使用交替最小二乘法（ALS）进行优化。ALS通过交替更新用户喜好特征矩阵U和产品特征矩阵V，逐步减小损失函数，实现矩阵补全。尽管ALS不保证全局最优解，但在实践中表现出良好的收敛性和效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、矩阵分解模型。

用户对物品的打分行为可以表示成一个评分矩阵A(m*n)，表示m个用户对n各物品的打分情况。如下图所示：

其中，A(i,j)表示用户user i对物品item j的打分。但是，用户不会对所以物品打分，图中？表示用户没有打分的情况，所以这个矩阵A很多元素都是空的，我们称其为“缺失值（missing value）”。在推荐系统中，我们希望得到用户对所有物品的打分情况，如果用户没有对一个物品打分，那么就需要预测用户是否会对该物品打分，以及会打多少分。这就是所谓的“矩阵补全（填空）”。

ALS 的核心就是下面这个假设：打分矩阵A是近似低秩的。换句话说，一个的打分矩阵 A 可以用两个小矩阵和的乘积来近似：。这样我们就把整个系统的自由度从一下降到了。我们接下来就聊聊为什么 ALS 的低秩假设是合理的。世上万千事物，人们的喜好各不相同。但描述一个人的喜好经常是在一个抽象的低维空间上进行的，并不需要把其喜欢的事物一一列出。举个例子，我喜欢看略带黑色幽默的警匪电影，那么大家根据这个描述就知道我大概会喜欢昆汀的《低俗小说》、《落水狗》和韦家辉的《一个字头的诞生》。这些电影都符合我对自己喜好的描述，也就是说他们在这个抽象的低维空间的投影和我的喜好相似。再抽象一些，把人们的喜好和电影的特征都投到这个低维空间，一个人的喜好映射到了一个低维向量，一个电影的特征变成了纬度相同的向量，那么这个人和这个电影的相似度就可以表述成这两个向量之间的内积。我们把打分理解成相似度，那么“打分矩阵A(m*n)”就可以由“用户喜好特征矩阵U(m*k)”和“产品特征矩阵V(n*k)”的乘积来近似了。矩阵U、矩阵V如下图所示：

最低0.47元/天解锁文章