目录
1. 基于用户的协同过滤
协同过滤算法通常是对一大群人进行搜索,并从中找出与我们品味想近的一小群人。算法会对这些人所偏爱对其他内容进行考查,并将他们组合起来构造出一个经过排名的推荐列表。
1.1 相似度评价值
既然要找到品味方面的相似度,就需要将个体与其他人进行比较,并计算他们的相似度评价值;
1.1.1 欧几里得距离:
这个比较简单,采用欧几里得度量方法即可:
1.1.2 皮尔逊相关度:
该相关系统是判断两组数据与某一直线的拟合程度的一种度量。公式较复杂,皮尔逊相关度修正了夸大分值,它在数据不是很规范的情况下会倾向于给出更好的结果,如:影评者对影评的评价总是相对于平均水平偏离很大。
皮尔逊相关度评价算法首先会找出两位评论者都曾评价过的物品,然后计算两者的评分总和与平方和,并求得评分的成绩和。最后算法利用这些计算结果计算出皮尔逊相关系数。