als算法参数_Spark2.0协同过滤与ALS算法介绍

最新推荐文章于 2024-01-18 09:35:04 发布

鲁舒天

最新推荐文章于 2024-01-18 09:35:04 发布

阅读量570

点赞数

文章标签： als算法参数

本文链接：https://blog.csdn.net/weixin_33093437/article/details/111969792

版权

本文介绍了Spark2.0中协同过滤算法ALS的原理，使用ALS进行矩阵分解来近似用户和产品的特征。探讨了ALS的参数选择，如分块数、正则化参数、秩、迭代次数等，以及如何通过调整这些参数来优化模型。并通过实验展示了不同参数组合下RMSE的变化，以确定最佳参数配置。

摘要由CSDN通过智能技术生成

ALS矩阵分解

一个的打分矩阵 A 可以用两个小矩阵和的乘积来近似,描述一个人的喜好经常是在一个抽象的低维空间上进行的，并不需要把其喜欢的事物一一列出。再抽象一些，把人们的喜好和电影的特征都投到这个低维空间，一个人的喜好映射到了一个低维向量，一个电影的特征变成了纬度相同的向量，那么这个人和这个电影的相似度就可以表述成这两个向量之间的内积。

我们把打分理解成相似度，那么“打分矩阵A(m*n)”就可以由“用户喜好特征矩阵U(m*k)”和“产品特征矩阵V(n*k)”的乘积。

矩阵分解过程中所用的优化方法分为两种：交叉最小二乘法(alternative least squares)和随机梯度下降法(stochastic gradient descent)。

损失函数包括正则化项(setRegParam)。

参数选取

分块数：分块是为了并行计算，默认为10。正则化参数：默认为1。秩：模型中隐藏因子的个数显示偏好信息-false，隐式偏好信息-true，默认false(显示) alpha：只用于隐式的偏好数据，偏好值可信度底线。非负限定 numBlocks is the number of blocks the users and items will be

partitioned into in order to parallelize computation (defaults to

10). rank is the number of latent factors in the model (defaults to 10). maxIter is the maximum number of iterations to run (defaults to 10). regParam specifies the regularization parameter in ALS (defaults to 1.0). implicitPrefs specifies whether to use the explicit feedback ALS variant or one adapted for implicit feedback data (defaults to false

which means using explicit feedback). alpha is a parameter applicable to the implicit feedback variant of ALS that governs the baseline confidence in preference

observations (defaults to 1.0). nonnegative specifies whether or not to use nonnegative constraints for least squares (defaults to false).

ALS als = newALS()

.setMaxIter(10)//最大迭代次数,设置太大发生java.lang.StackOverflowError

.setRegParam(0.16)//正则化参数

.setAlpha(1.0)

.setImplicitPrefs(false)

.setNonnegative(false)

最低0.47元/天解锁文章

鲁舒天

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
als算法参数_Spark2.0协同过滤与ALS算法介绍

ALS矩阵分解一个的打分矩阵 A 可以用两个小矩阵和的乘积来近似,描述一个人的喜好经常是在一个抽象的低维空间上进行的，并不需要把其喜欢的事物一一列出。再抽象一些，把人们的喜好和电影的特征都投到这个低维空间，一个人的喜好映射到了一个低维向量，一个电影的特征变成了纬度相同的向量，那么这个人和这个电影的相似度就可以表述成这两个向量之间的内积。我们把打分理解成相似度，那么“打分矩阵A(m*n)”就可以由...
复制链接

扫一扫