本节内容提要
在上节中,我们接触到不少相似度衡量(Similarity Measures)的方法,例如皮尔逊相关系数(PCC)、从向量夹角演化出的Cosine相似度、运用贝叶斯理论获得的概论计算公式。
在本节中,我们对相似度相关的算法和理论做一个系统而全面的梳理。
- 常用的相似度衡量方法
- Pearson Correlation Coefficient(PCC)
- Cosine Similarity(COS)
- 相关性分析
- 一些其他的相似度衡量方法
- Distance-based Similarities
- Set-based Similarities)
- Link-based Similarities
- Bayesian Similarity
皮尔逊相关系数(Pearson Correlation Coefficient/PCC)
皮尔逊相关系数公式
公式如下图,其中, a a a和 b b b是待比较的两个用户, r a , p r_{a,p} ra,p是用户 a a a对项目 p p p的评分,集合 P P P是用户 a a a和用户 b b b共同评分过的产品集, r a ˉ \bar{r_a} raˉ是用户 a a a对 P P