推荐系统协同过滤算法——矩阵分解模型

最新推荐文章于 2024-08-07 14:40:48 发布

PassionZheng

最新推荐文章于 2024-08-07 14:40:48 发布

阅读量3.7k

点赞数 3

分类专栏：推荐系统

本文链接：https://blog.csdn.net/select_alter_drop/article/details/82902551

版权

本文深入介绍了协同过滤算法，特别是矩阵分解模型在推荐系统中的应用，包括SVD及其局限性与突破。文章讨论了如何通过时间敏感的因子模型来改进预测准确度，同时涵盖了SVD++模型，强调了隐式反馈和时间效应的重要性。通过整合不同类型的用户反馈和考虑时间变化，模型的预测性能得到显著提升。

摘要由CSDN通过智能技术生成

文章目录

一.简介

协同过滤（CF）算法基于用户对商品的评分或其他行为模式（如购买），为用户提供个性化推荐，而不需要了解用户或者商品的大量信息。
本章，通过分析最近提出的一些扩展方法，给正在寻找推荐优化方案的研究人员提供一些建议和帮助。

1.推荐系统的输入

1）显式反馈

用户显式地表明其所感兴趣的产品集合。如：打分，星级，赞……

2）隐式反馈

通过收集整理用户的行为来间接得到用户的喜好[20]¹。
其包括用户的：

购买记录
浏览历史记录
搜索模式
甚至是鼠标移动

2.重点内容

本章重点关注与显式反馈相匹配的模型，同时也会展示怎么样在模型中把隐式反馈当作辅助信息来处理。

3.关联用户与物品的两种CF技术

为了生成推荐结果，CF系统需要关联两种有本质区别的实体：Users 和 Items 。
有两种方法关联这两种实体，它们构成CF的主要技术：

1）基于邻域的方法

其重点关注物品之间的关系或者用户之间的关系。

2）隐语义模型

例如矩阵分解模型：是把物品与用户—映射到相同的隐语义空间中去。

隐语义空间：

试图通过描述物品和用户两种实体在因子上的特征来解释评分，这些因子是根据用户的反馈自动推断出来的。

4.内容总结

产生具有更精准预测结果的方法，需要深化基础和减少对任意决策的依赖。在本章中：

1）阐述了一系列近期提出的对基本CF建模技术的改进方法
2）同样重要的是对数据中所有可用的信号或者特征的识别——即，利用其他信息源。
- 如考虑时间效应

传统技术解决了用户—物品评分数据中的稀疏问题，利用其他信息源可以显著提高推荐精度。
3.3 ：讨论了矩阵分解模型的相关技术，综合考虑了算法实现的便利性和相对高的预测准确度。
该节主要描述了这些技术：
1）背后理论、使用细节；
2）主要优势——处理数据额外特征的能力，这些额外特征包括隐式反馈和时序信息
3）以及如何增强矩阵分解模型来处理这些额外信息
3.4 ：讨论了基于邻域的方法（大多数是基于启发式的）：使用更加严格的公式来克服领域技术的缺点
3.5 ：更高级方法：基于普通邻域方法的原理，使用因式分解模型的典型技术——全局优化技术。
1）这个方法允许放宽对领域大小的限制，同时考虑了隐式反馈的时间效应信息。
2）该方法预测结果精度接近矩阵分解模型，同时具有一些实用优势
3.6 ：这些技术之间的根本联系
1）基于用户的领域方法和基于物品的领域方法在极限的时候将收敛于同一模型；
2）而且那时，两种模型都等价于一个简单的矩阵分解模型；

二.预备知识

符号

$m$ 个用户， $n$ 个物品
$u, v$ 代表用户， $i, j, l$ 代表物品
$r_{ui}$ 代表用户 $u$ 对物品 $i$ 的偏好， $\hat{r}_{ui}$ 代表预测的偏好程度
标量值 $t_{ui}$ ：表示评分 $r_{ui}$ 的时间，时间单位随着当前应用的情况而变化【可能是天数或者是小时】。
由于评分的稀疏性，评分 $r_{ui}$ 已知的 $(u, i)$ 对，存放在集合 $\mathcal{K}=\{(u,i):r_{ui}已知\}$ 中。
$R (u)$ ：表示用户 $u$ 评价过的所有物品的集合
$R (i)$ ：表示评价过物品 $i$ 的所有用户的集合
$N (u)$ ：包含用户 $u$ 提供过的隐式偏好信息的所有物品集合（如用户租用过、购买过、浏览过的物品）

正则化防止过拟合

用于评分的模型，通过拟合已经观测到的评分来进行学习。通过 $\lambda_1,\lambda_2$ 等参数来控制正则化，防止模型过拟合。
这些参数通常通过交叉验证来实现；且随着参数量增加，确定正则化参数的任务会变得越来越繁重。

2.1 基准预测

1.原理

CF模型试图捕捉用户与物品之间的交互作用，正是这些交互作用产生了不同的评分值。然而，大部分观察的评分值要么与用户相关，要么与物品相关，而与用户与物品之间的交互作用无关。

比如，典型的 CF数据显示了用户和物品中存在偏置——某些用户给出更高的评分和某些物品比其他物品得到更高评分的总趋势。

可以将这些与用户—物品交互作用无关的因子（也叫偏置）封装到基准预测中。这样的建模方法把真正代表用户—物品之间交互作用的那部分数据隔离开来，而把这部分数据放到更合适的用户偏好模型中。

2.公式

1.基准预测
设： $\mu$ 为总体平均评分，则未知评分 $r_{ui}$ 的基准预测 $b_{ui}$ 综合考虑了用户和物品两个因子。
$b_{ui} = \mu + b_u + b_i$
2.偏置参数的估计——最小二乘法+梯度下降
参数 $b_u ,b_i$ 分别表示用户 $u$ 和物品 $i$ 与评分平均值的偏差。可以通过解决最小二乘法问题来估计参数 $b_u ,b_i$ 的值：
$\min_{b_{*}} \sum_{(u,i) \in \mathcal{K}} (r_{ui}-\mu-b_u -b_i)^2 + \lambda_1(\sum_u b_u^2 +\sum_i b_i^2 )$
- 公式中第一项： $\sum_{(u,i) \in \mathcal{K}}(r_{ui}-\mu-b_u -b_i)^2$ ，用来寻找与已知评分数据拟合得最好的 $b_u ,b_i$ ；
- 第二项正则化项： $\lambda_1(\sum_u b_u^2 +\sum_i b_i^2 )$ ，通过对参数的复杂性增加惩罚因子来避免过拟合现象。
- 求解方法：可以使用随机梯度下降方法解决
3.偏置参数估计的第二种方法——简单，但准确率不高
把 $b_i$ 的计算和 $b_u$ 的计算分离开来：
1）对每一个物品 $i$ ，令：
$b_i = \frac {\sum_{u \in R(i)} (r_{ui}-\mu) } {\lambda_2 + |R(i)|}$
2）对每一个用户 $u$ ，令：
$b_u = \frac {\sum_{i \in R(u)} (r_{ui}-\mu - b_i) } {\lambda_3 + |R(u)|}$
3）通过正则化参数 $\lambda_2,\lambda_3$ ，可以把上述参数的均值缩小至0；其值由交叉验证确定。