基于KNN的协同滤波推荐算法实现
邻居模型通常也被称为k-最近邻模型,或者简称为kNN。KNN 模型可以获得精确的推荐结果并为结果给出合理的解释,它们是CF 推荐系统中最早被使用也是直至目前最流行的一类模型。
为了获得用户对产品的评分预测值,kNN 模型一般包括以下三步:
1. 计算相似度
这步中计算每对产品之间的相似度(similarity)。一些被广泛使用的相似度
测度包括:
Pearson correlation:
其中¯rm 和¯rn 分别表示电影m 和n 获得的评分平均值,而Pmn 表示对
电影m 和n 都提供了评分的用户集合,也即Pmn = Pm ∩ Pn 。