由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与传统的欧式距离不同的是它考虑到各种特性之间的联系。
在n维空间内的两个点x、y(都是n维的向量),它们之间的欧氏距离定义为:对应每维度下差值的平方求和后再求根号1/2,distance = sqrt((x1-x2)(y1-y2)(z1-z2)...)
其实这里n维空间内的每个点就是一个关于n个特征值的样本,欧氏距离没有考虑到不同特征值之间的权重、影响度,我们需要对不同的特征值x、y、z进行一个权重赋值,下面介绍Mahalanobis距离。
Mahalanobis距离的计算如下(考虑了不同特征值的对整体距离的影响)