推荐系统(3)-协同过滤2-矩阵分解算法

小陈同学-陈百万

于 2021-04-26 23:28:46 发布

阅读量379

点赞数

分类专栏：推荐系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_40624829/article/details/116093344

版权

推荐系统专栏收录该内容

6 篇文章 0 订阅

订阅专栏

协同过滤-矩阵分解算法

1.奇异值分解
2.梯度下降
3.矩阵分解方法的优缺点

《深度学习/推荐系统》读书笔记

（其实矩阵分解和协同过滤已经没有特别大的联系了）
2006年，在Netfilx举办的推荐算法竞赛中Netflix Prize Challenge中，以矩阵分解为主的推荐算法大放异彩，拉开了矩阵分解算法在业界流行的序幕。

Netflix 推荐场景–利用用户的行为历史，在Netflix视屏应用中为用户推荐喜欢的电影、电视剧或者纪录片。

矩阵分解算法基本思路–将用户和视频都表示成一个隐向量，计算每个用户隐藏向量和所有视频隐向量之间内积，将内积最大的topK的视屏推荐给目标用户。

$m * n$ 维共现矩阵 $R$ ，分解成 $m * k$ 维用户矩阵U，和 $k * n$ 维物品矩阵 $V$
$R = U * V$

则用户 $u$ 对物品i的重构评分为( $p_u$ -U矩阵的行向量， $q_i$ -V矩阵的列向量):
$\hat{r}_{ui}=q^T_ip_u\tag{2.6}$

迷惑点1:用户隐藏向量和所有视频隐向量之间内积，其实就是重构用户对每一部电影的品评分，推荐重构评分高的电影是如何实现了用户对未评分电影的预测的呢？
矩阵分解中缺失值该怎么处理呢？就是用户没有评分的项目。

矩阵分解的方法：特征值分解、奇异值分解、梯度下降
特征值分解–只能作用于方阵，不适用于分解用户-物品矩阵

1.奇异值分解

Singular Value Decomposition-SVD
$U_{m*m}\Sigma_{m*n} V_{n*n}$

近似分解：
$M\approx U_{m*k}\Sigma_{k*k} V_{k*n}$

缺点：不适用于大规模稀疏矩阵的分解

SVD要求原始共现矩阵是稠密的，需要对缺失的元素进行填充。
SVD时间复杂度高( $O(mn^2)$ )

2.梯度下降

SVD的缺点使得研究者门另求他路–梯度下降法（矩阵分解的主要方法）
基本思路–参数化 $q^T_ip_u$ ，使其和原始评分 $r_{ui}$ 的差距尽量小

正则化目标函数：
$\min_{q^*,p^*}\sum_{(u,i)\in K}(r_{ui}-q^T_ip_u)^2+\lambda(||q_i||^2+||p_u||^2)\tag{2.8}$

为了消除用户和物品打分的偏差，修正目标函数：
$\min_{q^*,p^*}\sum_{(u,i)\in K}(r_{ui}-\mu-b_u-b_i-q^T_ip_u)^2+\lambda(||q_i||^2+||p_u||^2+b_u^2+b_i^2)$

其中： $\mu$ 是全局偏差常数， $b_i$ 是物品偏差系数(物品i收到的平均评分)， $b_u$ 用户偏差系数(用户u给出评分的均值)

3.矩阵分解方法的优缺点

优点：

泛化能力强–数据稀疏时的相似度也能衡量
空间复杂度低
扩展性和灵活性–用户物品隐向量，与Embedding的思想相似，可以与其他特征进行拼接。

缺点：
矩阵分解还是下共现矩阵的基础下进行的。共现矩阵缺点–一个矩阵只能表征用户和物品之间的一种作用关系(点击，购买，评分)，特征表示能力弱。不便加入用户、物品的上下文相关特征。

小陈同学-陈百万

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
推荐系统(3)-协同过滤2-矩阵分解算法

协同过滤《深度学习/推荐系统》读书笔记上一小节的代码：spark 是个什么？
复制链接

扫一扫

专栏目录

小陈同学-陈百万 CSDN认证博客专家 CSDN认证企业博客

码龄7年

196: 原创

22万+: 周排名

170万+: 总排名

37万+: 访问

: 等级

4098: 积分

90: 粉丝

147: 获赞

83: 评论

848: 收藏

私信

关注

热门文章

分类专栏

MachineLearning 16篇
PaperNotes 22篇
MLTools 13篇
C++ 23篇
Python 26篇
PythonLibs 16篇
LinuxCommand 12篇
Git Tips 12篇
推荐系统 6篇
自然语言处理 10篇
PRML 4篇
学点数学 11篇
算法题 18篇
无数踩坑系列 7篇
JOTTING

最新评论

Linux(8)-Vim编辑器的使用
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
Linux(4)-资源-du,top,free,shutdown,gnome
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
Pytorch(1)-torch.Tensor特性与操作(创建、索引、均值、方差)
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
PythonLibs(10) - open (cvs, .json, .mat)
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
PythonLibs(9) - Logging
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。