推荐系统Lambda架构算法（三）：基于回归模型的协同过滤推荐算法及其实现（随机梯度下降法优化+交替最小二乘法优化）

最新推荐文章于 2022-12-04 22:32:51 发布

VIP文章汪雯琦

最新推荐文章于 2022-12-04 22:32:51 发布

阅读量1k

点赞数 2

分类专栏：【Lambda大数据开发】文章标签： python 机器学习算法数据分析深度学习

本文链接：https://blog.csdn.net/qq_35456045/article/details/104732467

版权

如果我们将评分看作是一个连续的值而不是离散的值，那么就可以借助线性回归思想来预测目标用户对某物品的评分。其中一种实现策略被称为Baseline（基准预测）。

Baseline设计思想基于以下的假设：

有些用户的评分普遍高于其他用户，有些用户的评分普遍低于其他用户。比如有些用户天生愿意给别人好评，心慈手软，比较好说话，而有的人就比较苛刻，总是评分不超过3分（5分满分）
一些物品的评分普遍高于其他物品，一些物品的评分普遍低于其他物品。比如一些物品一被生产便决定了它的地位，有的比较受人们欢迎，有的则被人嫌弃。

这个用户或物品普遍高于或低于平均值的差值，我们称为偏置(bias)

Baseline目标：

使用Baseline的算法思想预测评分的步骤如下：

计算所有电影的平均评分 $\mu$ （即全局平均评分）
计算每个用户评分与平均评分 $\mu的偏置值b_u$
计算每部电影所接受的评分与平均评分 $\mu的偏置值b_i$
预测用户对电影的评分：
$\hat{r}_{ui} = b_{ui} = \mu + b_u + b_i$
举例：通过Baseline来预测用户A对电影“阿甘正传”的评分
- 首先计算出整个评分数据集的平均评分 $\mu$ 是3.5分
- 用户A比较苛刻，普遍比平均评分低0.5分，即用户A的偏置值 $b_i$ 是-0.5；
- “阿甘正传”比较热门且备受好评，评分普遍比平均评分要高1.2分，“阿甘正传”的偏置是+1.2
- 因此就可以预测出用户A对电影“阿甘正传”的评分为： $3.5 + (- 0.5) + 1.2$ ，也就是4.2分。

对于所有电影的平均评分是直接能计算出的，因此问题在于要测出每个用户的评分偏置和每部电影的得分偏置。对于线性回归问题，我们可以利用平方差构建损失函数如下：

在这里插入图片描述

加入L2正则化：
$Cost=\sum_{u,i\in R}(r_{ui}-\mu-b_u-b_i)^2 + \lambda*(\sum_u {b_u}^2 + \sum_i {b_i}^2)$
公式解析：

关注