个性推荐算法说的很多了,常用的模型是:
U*V= Q
其中Q是评分表,一般共3列:用户id,物品id,评分值
U是用户特征表,V是物品特征表。
算法的最终目标就是从Q算出U和V。那么Spark Mllib里有ALS算法可以做矩阵分解,其基本原理是最小交叉二乘法,用到了Breeze库的矩阵函数库。所谓交叉二乘就是轮流固定U或V,来算出V或U。比如第一轮固定U,来算出V,第二轮固定算出的V,来算出U。直到最后误差收敛。
Spark里主要是用RDD框架来对数据分块计算,达到并行的特点。
而Tensorflow里用深度学习的方法来实现矩阵分解就更简便了,其基本原理是根据U*V和Q的差值来自动优化,深度学习的特点就是只要你搭建好了学习模型,那么只要自动训练就可以找到最优解,因此实现起来也很方便。
TensorFlow的代码可以参考:
https://blog.csdn.net/m0_38045485/article/details/81174728