mapreduce
用mapreduce计算框架实现了3个小demo: wordcount、基于物品的推荐算法(itemCF)和基于用户的推荐算法(userCF)
代码连接: https://github.com/marvelousgirl/mapreduce
itemCF步骤:
step1: 根据用户行为列表构建评分矩阵
map输入:key:LongWritable类型,每一行的起始偏移量 value: Text类型 userID,itemID,score
map输出:key:Text类型 itemID value: Text类型 userID_score
reduce输入:key:Text类型 itemID value: Text类型 <userID1_score, userID2_score, userID2_score, …>
reduce输出:key:Text类型 itemID value: Text类型 userID1_score,userID2_score,userID3_score
step2: 利用step1得到的评分矩阵,构建物品与物品的相似度矩阵,此处的相似度度量方法采用余弦相似度
此外ÿ