作为推荐系统的初级玩家,希望能够总结下各种用户相似度的原理和优缺点。希望对自己以及各位在推荐系统的学习有一点点帮助。下面列举几个常见的用户相似度计算,也希望大家进行补充:
- 欧式距离(Euclidean Distance)
- 曼哈顿距离 (Manhattan Distance)
- 余弦相似度 (Cosine Similarity)
- 皮尔逊相关系数 (Pearson correlation coefficient)
1. 欧式距离
![0c38de32499bd79a18409cdb927f90d0.png](https://i-blog.csdnimg.cn/blog_migrate/7f922a799c1d112486183ec967562bc8.jpeg)
欧氏距离(Euclidean Distance)也称欧几里得距离,指在m维空间中两个点之间的真实距离。这个距离基于我们熟悉的勾股定理,也就是求解三角形的斜边。简单的来说,欧氏距离就是两点之间的实际距离。
其中,