Spark MLlib中协同过滤之交替最小二乘法ALS原理与实践

最新推荐文章于 2024-07-18 06:22:07 发布

ErbaoLiu

最新推荐文章于 2024-07-18 06:22:07 发布

阅读量4.9k

点赞数 2

分类专栏：大数据 Spark 机器学习文章标签： Spark MLlib ALS 交替最小二乘法协同过滤

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l_15156024189/article/details/81712519

版权

机器学习同时被 3 个专栏收录

72 篇文章 6 订阅 ¥99.90 ¥299.90

订阅专栏

11 篇文章 1 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

本文深入探讨了Spark MLlib中的协同过滤推荐算法，重点介绍了交替最小二乘法（ALS）的原理，包括显示反馈ALS和隐式反馈ALS-WR。通过矩阵因子分解和交替最小二乘法的数学推导，解释了如何预测评分矩阵的缺失项。同时，展示了Spark MLlib中基于RDD和DataFrame的ALS实现，并讨论了冷启动策略和关键参数设置。

摘要由CSDN通过智能技术生成

请先阅读leboop发布的博文《Apache Mahout之协同过滤原理与实践》。

基于用户和物品的协同过滤推荐都是建立在一个用户-物品评分矩阵（user-item-score）展开的，其本质是利用现有数据填充矩阵的缺失项（missing entries），也就是预测评分。基于用户的协同过滤通过该评分矩阵来度量用户间的相似度（余弦相似度，距离相似度，皮尔森相似度，皮尔斯曼相似度等等）；然后，通过用户间的相似度来寻找被推荐用户u的k-最近邻用户{u1，u2，...，uk}；最后，加权{u1，u2，...，uk}给所有物品的评分来预测u尚未评分的每个物品的评分，按预测评分从高到低得到用户u的物品推荐列表{p1，p2，...，ph}；现在如果向用户u推荐一个物品，应当推荐p1，如果推荐两个物品，应当推荐p1和p2，以此类推。然而，这个算法并不能很好地适应大规模用户和物品数据，比如亚马逊Amazon数千万用户和数百万物品的在线商城，尽管大多数用户只评分或交易了非常少量的物品，复杂度非常低，但线上环境

了解本专栏

关注

2
点赞
踩
22

收藏

觉得还不错? 一键收藏
打赏
10
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ErbaoLiu 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。