技术工具: Hadoop、Spark统一部署环境,基于ALS协同过滤算法、MySql、Node.js 、Kettle工具(清洗数据)
数据集:MovieLens
推荐算法中存在 用户——物品 这样一个对应。产生的用户对物品喜爱度的矩阵可以通过先降维(矩阵分解),然后ALS求损失来构建协同过滤,来达到减少内存,降低存储时间复杂性。
降维部分的设计用到了L2正则。
上一篇论文也是协同过滤,两篇使用的相似度公式有些许差别,这篇减去了平均加权
ß《基于JSxxxx》
N是最临近的个数。分析与之相似度高的用户对该商品的喜爱度来预估目标用户的喜爱度。
ALS求解损失:ALS是求解L(P,Q)的著名算法,基本思想是固定其中1类参数,使其变为单类变量优化问题,利用解析方法进行优化;反之,固定先前优化的参数,再优化另一组参数。此过程迭代进行,直到收敛。
总结:这篇论文刚刚好对上一篇论文的协同过滤算法进行了一个改进,矩阵降维是很好的将问题简单化的方法,还有ALS交替计算都是我之前不知道的东西。