与欧式距离不同的是马氏距离考虑到各种特性之间的联 系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的),并且是尺度无关的(scale-invariant),即独立于测量尺 度。
在计算欧氏距离的根号内多除以一个协方差矩阵
我的理解是,若考虑各包含n个特征变量的两个特征向量v1,v2,要计算它们的距离,即相似度
如果向量中的特征变量所采用的尺度单位不同,则会造成各变量集的方差不同
这时候数据所在的空间就像被拉伸扭曲了,比如对二维而言,横轴用厘米,数轴用千米。