Spark ALS算法总结

最新推荐文章于 2020-12-24 16:09:55 发布

托拉法尔加l罗

最新推荐文章于 2020-12-24 16:09:55 发布

阅读量1.8k

点赞数

分类专栏： j

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liwenliang2/article/details/79886749

版权

j 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

守护之沙：http://sharkdtu.com/posts/ml-als.html

参数:

本文主要通过Spark官方的例子理解ALS协同过滤算法的原理和编码过程，然后通过对电影进行推荐来熟悉一个完整的推荐过程。

协同过滤

协同过滤常被应用于推荐系统，旨在补充用户-商品关联矩阵中所缺失的部分。MLlib当前支持基于模型的协同过滤，其中用户和商品通过一小组隐语义因子进行表达，并且这些因子也用于预测缺失的元素。Spark MLlib实现了交替最小二乘法(ALS) 来学习这些隐性语义因子。

在 MLlib 中的实现类为org.apache.spark.mllib.recommendation.ALS.scala，其有如下的参数:

numUserBlocks：是用于并行化计算的分块个数 (设置为-1，为自动配置)。
numProductBlocks：是用于并行化计算的分块个数 (设置为-1，为自动配置)。
rank：是模型中隐语义因子的个数。
iterations：是迭代的次数，推荐值：10-20。
lambda：惩罚函数的因数，是ALS的正则化参数，推荐值：0.01。
implicitPrefs：决定了是用显性反馈ALS的版本还是用适用隐性反馈数据集的版本。
alpha：是一个针对于隐性反馈 ALS 版本的参数，这个参数决定了偏好行为强度的基准。
seed：随机种子

可以调整这些参数，不断优化结果，使均方差变小。比如：iterations越多，lambda较小，均方差会较小，推荐结果较优。

托拉法尔加l罗

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。