假设空间中两个点x,y,定义
欧式距离(欧几里得距离)
Mahalanobis距离
不难发现,如果去掉马氏距离中的协方差矩阵,就退化为欧氏距离。那么我们就需要探究这个多出来的因子究竟有什么含义。
1、当S为单位矩阵时,马氏距离就是欧式距离,可以把马氏距离看成是欧式距离的一种修正。修正了欧式距离中各个维度吃醋不一致且相关的问题。
计算两个样本间的距离时,需要考虑样本所在的分布造成的影响,影响包括两个方面:
1。不同维度上的方差不同,进而不同维度在计算距离时的重要性不同;
2、不同维度间可能存在相关性,干扰距离计算。
当数据的分布已知时,我们通常会用马氏距离代替欧氏距离。
定义:
1。度量样本到样本分布间的距离