Spark上矩阵运算库(五)——高级矩阵操作1

本文回顾了工作中的高级矩阵操作,重点介绍了用于协同过滤算法的ALS(Alternating Least Squares)。ALS算法将评分矩阵分解为低秩矩阵和商品矩阵因子的乘积,通过已知评分数据学习这两个因子,以最小化重构误差。在Spark的MLlib中,ALS经过优化以提高性能。文中提到在Amazon Reviews dataset上的实验结果,并计划将ALS和其他高级矩阵操作纳入自建的矩阵库中。
摘要由CSDN通过智能技术生成

工作回顾


前面我们已经基于Spark设计并实现了常见的分布式矩阵操作,主要包括BLAS1-2的操作,如矩阵相加、相减、相乘等。

接下来的一阶段,我们的工作分类两部分。第一,继续完善基本操作,比如支持一些向量的操作;第二,实现1、2个高级矩阵操作,如矩阵的分解等等。


高级矩阵操作

矩阵的分解操作是众多矩阵高级操作中的一类被广泛研究的操作。很多高级矩阵操作(如矩阵求逆)可以转换为矩阵的分解。本周我们介绍并引入MLlib为实现协同过滤算法而包含的矩阵分解算法——Alternating Least Squares (ALS).



ALS将推荐系统中的评分矩阵看成是有一个low-rank 矩阵和商品矩阵因子相乘得到。算法通过已经观察到的评分数据学习出这两个因子,学习的约束是尽量降低重构出矩阵的误差。一旦我们学习出这两个子矩阵,原来矩阵中其他的元素就可以通过这两个因子相乘得到.ALS是一个迭代的算法,每轮计算过程中算法固定住其中一个因子去优化另一个(这一点和EM很像),不断交替直到收敛。该算法已经在Mllib里面有包含,并在底层采用了LAPACK包进行了优化。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值