距离的基本特征
假定有一些点组成的集合,我们称这个集合为空间(space)。这个空间下的距离测度为一个函数d(x,y),以空间中的x点与y点作为参数,输出一个实数值。该函数必须满足以下准则:
- d(x,y)≥0 【距离非负数】
- d(x,y)=0 当且仅当x点与y点重合
- d(x,y)=d(y,x)
- d(x,y)≤d(x,z)+d(z,y) 【三角不等式】
这其中最难满足的是第五条三角不等式
欧几里得距离 Euclidean Distance
Jaccard距离
d(x,y) = 1 - SIM(x,y)
SIM(x,y)为x与y的jaccard相似度。计算方法为:SIM(x,y)=|X∩Y|/|X∪Y|
余弦距离 Cosine Distance
类似高中学的余弦角度计算。。。