基于矩阵分解的推荐算法

最新推荐文章于 2024-06-21 11:17:49 发布

mlee1018

最新推荐文章于 2024-06-21 11:17:49 发布

阅读量1.2w

点赞数 4

分类专栏： ML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Recall_Tomorrow/article/details/80218051

版权

ML 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

推荐系统

$\ \ \ \$ 我们知道，协同过滤算法（Collaborative Filtering）是最常用的推荐算法，其就是通过从用户（User）的历史行为数据中挖掘出用户的兴趣，并为其推荐可能感兴趣的项（Item），常用的方法有，基于用户的协同过滤算法和基于项的协同过滤算法。
$\ \ \ \$ 我们采用常用的相似度度量方法，欧氏距离（Euclidean Distance）、皮尔逊相关系数（Pearson Correlation）、余弦相似度（Cosine Similarity），以上三种度量方法均满足拓扑学度量空间三要素，即非负性、对称性、三角不等性。此处我们不打算展开讲解以上两种算法，而是重点说明基于模型的协同过滤算法中的一种—–矩阵分解（Matrix Factorization），另外大家有兴趣也可以查看一下基于图的推荐算法（PersonalRank）的简单实现点这里。。。 ^-^。

矩阵分解

$\ \ \ \$ 此处我们只将用户—商品矩阵 $R_{m\times n}$ 分解为两个矩阵 $P_{m\times k}$ 和 $Q_{k\times n}$ ，使得满足，

R m \times n \approx P m \times k \times Q k \times n = R^m \times n

$R_{m\times n}\approx P_{m\times k}\times Q_{k\times n}=\hat{R}_{m\times n}$ 从而补全那些缺失值，进而为用户推荐那些可能感兴趣的商品。

$\ \ \ \$ 我们将使用最小二乘法对那些非缺失的值进行损失评估，即

e 2 = (r i j - r^i j) 2 = (r i j - \sum l = 1 k p i l \times q l j) 2

$e^2=(r_{ij}-\hat r_{ij})^2=(r_{ij}-\sum_{l=1}^{k}p_{il}\times q_{lj})^2$ 另外我们使用

L2 L 2 $L_2$ 正则化，

L 2 = \sum l = 1 k (p 2 i l + q 2 l j)

$L_2=\sum_{l=1}^{k}(p_{il}^2+q_{lj}^2)$ 其中

i∈[1,m],j∈[1,n] i ∈ [ 1 , m ] , j ∈ [ 1 , n ] $i\in[1, m], j\in[1, n]$ , k是我们所指定的大小，因此最终的损失函数为，

l o s s (p i l, q l j) = e 2 + β 2 L 2 其 中 p i l, q l j 即 为 分 解 的 两 个 矩 阵 中 的 元 素 ， 也 就 是 求 解 参 数

$loss(p_{il}, q_{lj})=e^2+\frac{\beta}{2}L_2\ \ 其中p_{il},q_{lj}即为分解的两个矩阵中的元素，也就是求解参数$ 接下来我们就可以使用梯度下降算法求解

Pm×k P m × k $P_{m\times k}$ 和

Qk×n Q k × n $Q_{k\times n}$

\nabla p l o s s = \partial l o s s \partial p i l = - 2 (r i j - r^i j) q l j + β p i l = - 2 e i j q l j + β p i l

$\nabla_{p}{loss}=\frac{\partial\ loss}{\partial p_{il}}=-2(r_{ij}-\hat{r}_{ij})q_{lj}+\beta p_{il}=-2e_{ij}q_{lj}+\beta p_{il}$

\nabla q l o s s = \partial l o s s \partial q l j = - 2 (r i j - r^i j) p i l + β q l j = - 2 e i j p i l + β q l j

$\nabla_{q}{loss}=\frac{\partial\ loss}{\partial q_{lj}}=-2(r_{ij}-\hat{r}_{ij})p_{il}+\beta q_{lj}=-2e_{ij}p_{il}+\beta q_{lj}$
So…,

p i l = p i l - \nabla p l o s s

$p_{il} = p_{il}-\nabla_ploss$

q l j = q l j - \nabla q l o s s

$q_{lj} = q_{lj}-\nabla_qloss$ 这样我们就可以通过迭代（迭代次数，误差容忍度。。。）直到收敛。
实现完整代码点这里。。。

关注

4
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
基于矩阵分解的推荐算法

推荐系统&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;\ \ \ \ 我们知道，协同过滤算法（Collaborative Filtering）是最常用的推荐算法，其就是通过从用户（User）的历史行为数据中挖掘出用户的兴趣，并为其推荐可能感兴趣的项（Item），常用的方法有，基于用户的协同过滤算法和基于项的协同过滤算法。 &a
复制链接

扫一扫

专栏目录

mlee1018 CSDN认证博客专家 CSDN认证企业博客

码龄10年

57: 原创

13万+: 周排名

3万+: 总排名

22万+: 访问

: 等级

2458: 积分

36: 粉丝

99: 获赞

18: 评论

262: 收藏

私信

关注

热门文章

分类专栏

golang 1篇
数据结构 21篇
java 5篇
c-c++ 2篇
剑指Offer 11篇
Linux 3篇
git
python 2篇
nlp 2篇
ML 15篇

最新评论

golang并发（同步）多任务高性能执行&聚合
CSDN-Ada助手: 不知道 Go 技能树是否可以帮到你：https://edu.csdn.net/skill/go?utm_source=AI_act_go
RNN(LSTM)数据形式及Padding操作处理变长时序序列dynamic_rnn
CSDN-Ada助手: 非常感谢您分享关于RNN(LSTM)数据形式及Padding操作处理变长时序序列dynamic_rnn的博客，我觉得这是一个非常实用的技术，对其他用户也会有很大的帮助。下一篇博客建议可以继续写关于RNN的相关技术，比如“使用RNN(LSTM)进行文本分类”，这是一个非常热门的话题，相信会吸引更多读者前来阅读。期待您更多的优质内容！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
三个字符串s1, s2, s3, 现要求你判断s3是否由s1和s2交错组成的
杨缘一: 为什么for循环不从1开始遍历？
java实现登录窗口(含验证码验证、账户注册等)
mlee1018: 包名
java实现登录窗口(含验证码验证、账户注册等)
zzzbel: i了i了拯救作业人

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。