目录
相似度Similar
- 皮尔森相关系数Person correlation coefficient: 实际上也是一种余弦相似度,不过先对向量做了中心化,向量X和 Y 各自减去向量的均值后,再计算余弦相似度。
- 余弦相似度:度量两个向量之间的夹角,用夹角的余弦值来表示相似度。
夹角 余弦值 相关性 [0,90) (0,1] 正相关 90 0 不相关 (90,180] [-1,0) 负相关
计算相似度
player\games | game1 | game2 | game3 | game4 | game5 | game6 | game7 |
---|---|---|---|---|---|---|---|
A | 10 | 2 | 9 | 8 | null | null | 8 |
B | 10 | 4 | null | 2 | 6 | 8 | 10 |
C | 8 | null | 6 | 10 | 3 | null | 4 |
D | null | null | 4 | 8 | null | 10 | 10 |
E | 6 | 8 | null | null | null | 10 | 8 |
F | 10 | 4 | 4 | ? | ? | ? | 6 |
求F和A的皮尔森相关系数
step1:求均值(只计算共同项):
step2:求r:
同理,依次计算出F和B、F和C、F和D、F和E的相关系数分别为:0.59、0.88、0.65、1、-0.95。
根据相似度做预测
计算预测结果,如求(F,game4):
step1:求出与F正相关的向量(i..m)的均值。
step2:根据公式 求predicition。
结论,由于Predicition=5.59 小于 F的平均值6,所以不推荐game4给F。