介绍的五种距离度量方法是:欧氏距离(Euclidean Distance),曼哈顿距离(Manhattan Distance),夹角余弦(Angle Cosine),切比雪夫距离(Chebyshev Distance),汉明距离(Hamming Distance)。
1.欧式距离(Euclidean Distance)
1.1数学公式
Euclidean Distance,即两点之间的直线距离,数学公式如下所示。
(1)二维平面上两点a(x1,y1),b(x2,y2)之间的欧式距离公式
(2)n维空间上两点a(x1,x2……..xn),b(y1,y2……..yn)的欧式距离公式
1.2Python实现
欧氏距离的实现用了三种方法:
1)lambda+[]
2)function + np.frompyfunc
3)lambda + np.frompyfunc
lambda + np.frompyfunc是最舒服的一种实现(多个)序列之间相互操作的方法。
# -*- coding: utf-8 -*-
"""
@author: 蔚蓝的天空tom
Aim:五种度量距离方法实现
"""
import numpy as np
def EM1(p):#数学公式法
'''EuclideanMetric, 欧几里得距离, 也称欧氏距离'''
y = lambda a,b : np.power(a-b,2)
s = sum([y(a,b) for (a,b) in zip(p[0], p[1])])
em = np.sqrt(s)
return em
def e_func(a,b):
'''求两个数的差的平方'''
return np.power(a-b,2)
def EM2(P):#function + np.frompyfunc方法
'''EuclideanMetric, 欧几里得距离, 也称欧氏距离'''
func = np.frompyfunc(e_func, 2, 1)
s = sum(func(P[0],P[1]))
em = np.sqrt(s)
return em
def EM3(P):#lambda + np.frompyfunc方法
e_func = lambda a,b : np.power(a-b,2)
func = np.frompyfunc(e_func, 2, 1)
s = sum(func(P[0],P[1]))
em = np.sqrt(s)
return em
def EM4(P):#向量法
P = np.array(P)
K = P[0] - P[1]
em = np.sqrt(sum(K * K.T))#向量乘
return em
if __name__=='__main__':
#二维空间,(1,2), (3,4)
p = [[1,2], #p1 = (1,2)
[3,4]] #p2 = (3,4)
print('em:', EM1(p), EM2(p),EM3(p), EM4(p))
#4维空间,(1,2,3,4), (5,6,7,8)
p = [[1,2,3,4], #p1 = (1,2,3,4)
[5,6,7,8]] #p2 = (5,6,7,8)
print('em:', EM1(p), EM2(p), EM3(p), EM4(p))
运行结果:
runfile('C:/Users/tom/5_distance.py', wdir='C:/Users/tom')
em: 2.82842712475 2.82842712475 2.82842712475 2.82842712475
em: 8.0 8.0 8.0 8.0
2.曼哈顿距离(Manhattan Distance)
2.1数学公式
ManhattanDistance,就是相同数轴坐标差的绝对值的和