协同过滤推荐算法_推荐系统（2）--传统推荐算法之协同过滤及矩阵分解

最新推荐文章于 2023-01-27 18:27:28 发布

weixin_39807896

最新推荐文章于 2023-01-27 18:27:28 发布

阅读量763

点赞数

文章标签：协同过滤推荐算法

深度学习技术在推荐领域的影响极大。本文将推荐算法分为前深度学习时代的传统推荐算法和深度学习算法。

传统的推荐算法最主要包括：协同过滤算法，逻辑回归类算法，因子分解机算法，组合的方法。

核心思想：基于用户或物品的相似度，对物品进行推荐。算法工作包括基于User和Item的行为构建共现矩阵，相似度计算，结果进行排序。

余弦相似度：

存在的问题：

相似度依赖于共同评价的用户数，不是关注评分的多少。
- 举例来说：A用户对电影a，b评分为[1,2]；B用户对电影a，b评分为[4,5]。通过计算可以发现他们的余弦相似度0.98。实际上A和B的观影差异较大。

改进的余弦相似度计算：

减去纵向的均值（和皮尔逊相似度不一样）。
举例来说：A[1,2]，B[4,5]；减去纵向均值得到A’[1-2.5，2-3.5]和B‘[4-2.5，5-3.5]。再通过计算A’和B‘的余弦相似度能够避免上面提到的问题。

皮尔逊相关系数

向量中心化，减去向量的均值。排除掉用户的评分偏差。

实际应用当中，感觉在召回阶段都可以试一下。

解决的关键问题：弥补协同过滤无法处理稀疏矩阵的问题。-->用稠密隐向量表示user和item，挖掘用户和物品的隐含特征和关系。

矩阵分解协同过滤的共现矩阵得到的。R(nXm) = U(xXk).V(kXm)；k隐向量的维度代表向量的表达能力。维度越高的话，表达能力越强，泛化能力越弱。

1、SVD分解：细节见线性代数教材。

2、梯度下降法（原始评分矩阵与用户向量和物品向量点积最小）

计算步骤：

3. 梯度方向更新U和V的元素值。重复直到达到停止条件（迭代轮次或loss小于某个值）。

优化改进方案：

3、矩阵分解方法的优缺点

优点：

缺点：

关注