看了Mahout的基于用户的协同过滤算法的实现
推荐主要包含以下步骤:
1、根据用户对于物品的已有偏好值,计算各个用户之间的相似度(如,皮尔逊相关系数)
2、获取当前用户的最相似的N个用户
3、获取当前用户没有给出偏好的,N个用户已给出偏好的物品集合
4、通过(SUM(当前用户偏好值x与当前用户相似度)/总相似度)计算物品对于N个用户的平均偏好
5、获取TopN个物品作为用户的推荐结果返回
评分的主要步骤:
1、根据用户对于物品的已有偏好值,计算各个用户之间的相似度(如,皮尔逊相关系数)
2、获取当前用户的最相似的N个用户
3、将数据集分为训练集和验证集
4、使用训练集,通过(SUM(当前用户偏好值x与当前用户相似度)/总相似度)计算物品对于N个用户的平均偏好,即预测值
5、与验证集进行比较,计算验证集与预测值偏好的差值的平均值
计算准确率、召回率、散落率
1、根据当前用户的物品的偏好,确定阈值(偏好均值+偏好标准差)
2、获取当前用户大于阈值的好的物品个数
3、根据其他用户的物品和当前用户的非好物品,计算at个推荐物品(见上推荐的步骤)
4、求2中个数和3中个数的交集,计算准确率、召回率、散落率