协同过滤(Collaborative Filtering,简称CF)
协同过滤常常被用于分辨某位特定顾客可能感兴趣的东西,这些结论来自于其他相似顾客对哪些产品感兴趣的分析。
数据结构
协同过滤,主要收集每个用户对使用过的物品的评价。
评价可以理解为经常在电商网站上出现的,五星级的评分。
注意:不同用户的评分标准不同,所以需要对评分进行标准化处理。
标准化为0-1之间的值。
①用户评分向量
②商品评分向量
③向量距离计算(采用欧氏距离)
④相似度计算(Similarity)
sim(x,y)=1/1+d(x,y)
⑤越接近1越相似,