假设原始数据为
X
X
X,其协方差矩阵
C
C
C为对称矩阵,协方差矩阵的特征分解为
C
=
R
S
R
−
1
=
R
S
R
T
(
C
为
对
称
矩
阵
所
以
有
R
−
1
=
R
T
)
C=RSR^{-1}=RSR^{T}(C为对称矩阵所以有R^{-1}=R^{T})
C=RSR−1=RSRT(C为对称矩阵所以有R−1=RT)
其中 R R R为特征向量组成的正交矩阵,每一列是一个特征向量,所有特征向量组成一组正交基,根据 R R R对数据进行坐标旋转后消除相关性; S S S为特征值组成的对角矩阵,它实际上是旋转后的数据的协方差矩阵,由于旋转后的数据各维度是相互独立的,所以协方差为零,只有对角线有值,即每个维度的方差,利用 S S S可对旋转后的数据进行缩放(利用旋转后每个维度的方差)。
首先对数据进行旋转
Y
=
X
R
Y=XR
Y=XR
再对
Y
Y
Y进行缩放,除以各维度的标准差
Z
=
Y
S
−
1
Z=Y\sqrt{S^{-1}}
Z=YS−1
这就是马氏变换,在马氏变换后的空间
Z
Z
Z中计算欧式距离就相应得到原始空间
X
X
X的马氏距离。马氏距离的推导见。