距离和相似度
常见的距离计算方法
1.欧式距离(Euclidean Distance)
- 欧式距离是一个欧式空间下度量距离的方法,在同一个空间下的两个点,假如叫做p,q,分别都是n个坐标,那么欧式距离就是衡量这两个点之间的距离(欧氏距离不适用于布尔向量之间)
E ( p , q ) = ∑ i = 1 n ( p i − q i ) 2 E(p,q)=\sqrt{\sum_{i=1}^{n}(p_i-q_i)^2} E(p,q)=i=1∑n(pi−qi)2 - 欧氏距离的值是一个非负数,最大值正无穷,通常计算相似度的结果希望是[-1,1]或[0,1]之间,一般可以使用
s i m i l a r i t y = 1 1 + E ( p , q ) similarity=\frac{1}{1+E(p,q)} similarity=1+E(p,q)1
2.曼哈顿距离(Manhattan Distance)
d = ∑ i = 1 n ∣ x i − y i ∣ d={\sum_{i=1}^{n}|x_i-y_i|} d=i=1