个性推荐算法的Spark和Tensorflow实现对比

最新推荐文章于 2024-01-21 03:40:38 发布

choushi5845

最新推荐文章于 2024-01-21 03:40:38 发布

阅读量781

点赞数

原文链接：https://my.oschina.net/u/778683/blog/3092567

版权

个性推荐算法说的很多了，常用的模型是：

U*V= Q

其中Q是评分表，一般共3列：用户id，物品id，评分值

U是用户特征表，V是物品特征表。

算法的最终目标就是从Q算出U和V。那么Spark Mllib里有ALS算法可以做矩阵分解，其基本原理是最小交叉二乘法，用到了Breeze库的矩阵函数库。所谓交叉二乘就是轮流固定U或V，来算出V或U。比如第一轮固定U，来算出V，第二轮固定算出的V，来算出U。直到最后误差收敛。

Spark里主要是用RDD框架来对数据分块计算，达到并行的特点。

而Tensorflow里用深度学习的方法来实现矩阵分解就更简便了，其基本原理是根据U*V和Q的差值来自动优化，深度学习的特点就是只要你搭建好了学习模型，那么只要自动训练就可以找到最优解，因此实现起来也很方便。

TensorFlow的代码可以参考：

转载于:https://my.oschina.net/u/778683/blog/3092567

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注