距离计算总结
其中
1、余弦距离
2、欧式距离
3、曼哈顿距离(Manhattan Distance)
4、闵可夫斯基距离
其中:p=1是曼哈顿距离
P=2是欧式距离
P=∞是切比雪夫距离
5、切比雪夫距离(Chebyshev Distance)
这个公式的另一种等价形式是:
6、杰卡德距离
杰卡德相似系数:两个集合A和B的交集元素在A和B的并集中华所占的比例,用J(A,B)表示
杰卡德相似系数:
杰卡德距离:
7、汉明距离
将一个字符串换为另一个字符串所需要替换的字符个数
例:例如字符串“1111”与“1001”之间的汉明距离为2。
8、标准化欧式距离(Standardized Euclidean distance)
定义:标准化欧氏距离是针对简单欧氏距离的缺点而作的一种改进方案。标准欧氏距离的思路:既然数据各维分量的分布不一样,那我先将各个分量都“标准化”到均值、方差相等吧。假设样本集X的均值(mean)为m,标准差(standard deviation)为s,那么X的“标准化变量”表示为:
(标准化后的值 = ( 标准化前的值 - 分量的均值 ) /分量的标准差)
(也可以叫做加权欧式距离)
8、皮尔逊相关系数