1 通过 Euclidean distance 和 Pearson correlation.寻找用户得“相似度”,Euclidean比较好理解,和曼哈顿差不多,而
Pearson 就比较高深了,是按照两组数据所产生得“直线”(correlation)来比较相似度,直线的度数(45度为绝对相似)。
2根据相似度,某物所产生的推荐值也不同(设x是寻找者,y被询问者,y对于x的推荐值是x和y的详细度*y个人的推荐值)
所有的被询问者的平均值就是某物的推荐值,根据推荐值的高低排列
3delicious的例子,相似度的一个特别的用处是,发现同一用户是不是用不同的账号来提高某个网址的关注度。
4User-Based or Item-Based Filtering?
Item-based Filtering 在有很多数据的时候性能上要优于,首先要创建一个item-相似表(可能需要一些时间)。