前言
本篇记录余弦距离,汉明距离,测地距离,布雷柯蒂斯距离。
余弦距离
又名余弦相似度,用于衡量向量方向上的差异:
d
(
x
,
y
)
=
x
⋅
y
∣
x
∣
∣
y
∣
d(x,y)=\frac{x \cdot y}{|x||y|}
d(x,y)=∣x∣∣y∣x⋅y
汉明距离
用于衡量两个等长字符串(0-1序列)的相似程度:
d
(
x
,
y
)
=
∣
∣
x
−
y
∣
∣
0
d(x,y)=||x-y||_0
d(x,y)=∣∣x−y∣∣0
测地距离
原本用于测量地表两点之间的最短距离。例如一只蚂蚁在地球仪上从一点走到对面一点,走的最短路径即测地距离(沿着圆弧),而两点之间的直线距离是欧式距离。
布雷柯蒂斯距离
d ( x , y ) = ∑ i = 1 n ∣ x i − y i ∣ ∑ i = 1 n ∣ x i + y i ∣ d(x, y)=\frac{\sum_{i=1}^n |x_i-y_i|}{\sum_{i=1}^n |x_i + y_i|} d(x,y)=∑i=1n∣xi+yi∣∑i=1n∣xi−yi∣