基于回归模型的协同过滤推荐

最新推荐文章于 2024-10-17 08:00:29 发布

二十三号

最新推荐文章于 2024-10-17 08:00:29 发布

阅读量172

点赞数

文章标签：推荐算法 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47966242/article/details/125859085

版权

本文详细介绍了基于回归模型的协同过滤推荐方法，包括基准预测的原理、目标和步骤，以及随机梯度下降法和交替最小二乘法的公式推导和算法实现。通过对用户和物品偏置值的计算，预测用户对电影的评分，从而实现个性化推荐。

摘要由CSDN通过智能技术生成

基于回归模型的协同过滤推荐

如果我们将评分看作是一个连续的值而不是离散的值，那么就可以借助线性回归思想来预测目标用户对某物品的评分。其中一种实现策略被称为Baseline（基准预测）

Baseline：基准预测

Baseline设计思想基于以下的假设：

有些用户的评分普遍高于其他用户，有些用户的评分普遍低于其他用户。比如有些用户天生愿意给别人好评，心慈手软，比较好说话，而有的人就比较苛刻，总是评分不超过3分（5分满分）
一些物品的评分普遍高于其他物品，一些物品的评分普遍低于其他物品。比如一些物品一被生产便决定了它的地位，有的比较受人们欢迎，有的则被人嫌弃。

这个用户或物品普遍高于或低于平均值的差值，我们称为偏置(bias)

Baseline目标

找出每个用户普遍高于或低于其他用户的偏置值 $b_u$
找出每件物品普遍高于或低于其他物品的偏置值 $b_i$
我们的目标也就转化为寻找最优的 $b_u$ 和 $b_i$

Baseline步骤

计算所有电影的平均评分 $\mu$ （即全局平均评分）
计算每个用户评分与平均评分 $\mu$ 的偏置值 $b_u$
计算每部电影所接受的评分与平均评分 $\mu$ 的偏置值 $b_i$
预测用户对电影的评分：
$\hat{r}_{ui} = b_{ui} = \mu + b_u + b_i$

Baseline举例

比如我们想通过Baseline来预测用户A对电影“阿甘正传”的评分，那么首先计算出整个评分数据集的平均评分 $\mu$ 是3.5分；而用户A是一个比较苛刻的用户，他的评分比较严格，普遍比平均评分低0.5分，即用户A的偏置值 $b_u$ 是-0.5；而电影“阿甘正传”是一部比较热门而且备受好评的电影，它的评分普遍比平均评分要高1.2分，那么电影“阿甘正传”的偏置值 $b_i$ 是+1.2，因此就可以预测出用户A对电影“阿甘正传”的评分为： $3.5 + (- 0.5) + 1.2$ ，也就是4.2分

公式推导

对于所有电影的平均评分 $\mu$ 是直接能计算出的，因此问题在于要测出每个用户的 $b_u$ 值和每部电影的 $b_i$ 的值。对于线性回归问题，我们可以利用平方差构建损失函数如下：

$\begin{split} Cost &= \sum_{u,i\in R}(r_{ui}-\hat{r}_{ui})^2 \\&=\sum_{u,i\in R}(r_{ui}-\mu-b_u-b_i)^2 \end{split}$

加入L2正则化：
$Cost=\sum_{u,i\in R}(r_{ui}-\mu-b_u-b_i)^2 + \lambda*(\sum_u {b_u}^2 + \sum_i {b_i}^2)$
公式解析：

公式第一部分 $\sum_{u,i\in R}(r_{ui}-\mu-b_u-b_i)^2$ 是用来寻找与已知评分数据拟合最好的 $b_u$ 和 $b_i$

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

二十三号 CSDN认证博客专家 CSDN认证企业博客

码龄4年

6: 原创

151万+: 周排名

38万+: 总排名

2931: 访问

: 等级

63: 积分

0: 粉丝

3: 获赞

3: 评论

16: 收藏

私信

关注

热门文章

最新评论

距离与相似度
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
协同过滤算法
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。