常用的距离有:欧式距离、马氏距离、曼哈顿距离、汉明距离。下面进行分别介绍。
1. 欧氏距离
欧氏距离又称为欧几里得度量(euclidean metric)。通常在二维平面或者三维空间中两点间的直线距离就是欧氏距离。在n维空间下的一个点可以表示为
(x 1 ,x 2 ,...,x n )
(
x
1
,
x
2
,
.
.
.
,
x
n
)
.设在n维空间有A、B两点,相应的坐标分别为
(a 1 ,a 2 ,...,a n )
(
a
1
,
a
2
,
.
.
.
,
a
n
)
,
(b 1 ,b 2 ,...,b n )
(
b
1
,
b
2
,
.
.
.
,
b
n
)
,则A、B两点的欧氏距离
d
d
的计算公式如下:
2. 马氏距离
马氏距离(Mahalanobis distance)是用来度量一个样本点P与数据分布为D的集合的距离。
3. 曼哈顿距离
曼哈顿距离(Manhattan distance)又称出租车距离。
4. 汉明距离
汉明距离是使用在数据传输差错控制编码里面的,汉明距离是一个概念,它表示两个(相同长度)字对应位不同的数量,我们以d(x,y)表示两个字x,y之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。