第1关:基于物品的推荐算法
任务描述
本关任务:给用户2推荐2个商品。利用spark.mllib中的矩阵计算库,构建用户与物品的打分矩阵,然后计算物品之间的相似分数,进行推荐。实现基于用户(User CF)的协同过滤算法。
相关知识
基于物品的推荐算法步骤包括:
1.构建用户对物品的打分矩阵。如下表所示。
Item1 Item2 Item3 Item4 Item5 Item6
User1 4 3 5
User2 5 4 4
User3 4 5 3 4
User4 3 5
User5 4 4
User6 2 4 5
2.根据余弦相似度公式计算物品相似度矩阵
3.得到其他商品与被推荐用户已购买商品的相似度。对于每个商品,计算相似度之和,并将相似度最高的N个物品推荐给用户
编程要求
根据提示,在右侧编辑器补充代码.
实现:ij1表示其他用户购买过,但不在用户2购买的商品列表中的商品和评分,ij2表示将ij1中商品的评分求和,并降序排序,推荐前两个物品。
测试说明
根据代码中提示,取消部分注释。然后进行以下代码编写
使用filter操作,过滤得到ij中不是用户2已购买商品的商品和评分
使用reduceByKey操作,将ij1中商品分数按照商品id进行求和
使用sortBy操作,对评分进行排序
使用take操作,得到前两个商品。
开始你的任务吧,祝你成功!
import org