一、欧式距离
欧式距离就是在m维空间中两个点之间的真实距离。二维空间中的欧式距离就是两点之间的直线距离。大家对欧式距离比较熟悉,也就不多介绍了。
欧式距离缺点:
1.它不考虑总体分布对个体距离的影响,
将数据不同维度之间的统计差异、物理意义等同看待。比如现在有两套房子,我们把房子的价值按:大小、新旧、位置、家具来进行数据表达,A房子:大小200平方、使用10年、坐落市中心0、没有家具0。 B房子:大小50平方、使用10年、坐落市中心0、屋内有一张价值10万元的画。显然就房子价值来说A房子比B房子价值高,因为画很可能不是房子的附属物品,但是就计算欧式距离来说,二者的价格距离可能很近,这就是因为欧式距离忽略了不同属性之间的差异。
2.由1可以理解,欧氏距离受
变量的量纲影响。
二、马氏距离
马氏距离解决了上述欧式距离的两个缺点,列举两个图来说明问题: