概念
马哈拉诺比斯距离 Mahalanobis Distance,简称马氏距离,是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。
计算方法
假设某样本集服从均值为
μ
\mu
μ,协方差矩阵为
Σ
\Sigma
Σ 的高斯分布,则该空间上的任意一个点
x
x
x 到样本集均值
μ
\mu
μ 的马氏距离可以表示为
d
(
x
,
μ
)
=
(
x
−
μ
)
T
Σ
−
1
(
x
−
μ
)
d(x,\mu)=\sqrt{(x-\mu)^T\Sigma^{-1}(x-\mu)}
d(x,μ)=(x−μ)TΣ−1(x−μ)
推算与证明
协方差矩阵
Σ
\Sigma
Σ 特征值分解
Σ
=
U
Q
U
T
\Sigma=U Q U^T
Σ=UQUT
其中
U
=
[
u
1
,
u
2
,
.
.
.
,
u
p
]
U=[\textbf{u}_1,\textbf{u}_2,...,\textbf{u}_p]
U=[u1,u2,...,up] 是由归一化后的特征列向量组成的正交矩阵,满足
U
U
T
=
E
UU^T=E
UUT=E,
U
−
1
=
U
T
U^{-1}=U^T
U−1=UT,
(
U
T
)
−
1
=
U
(U^T)^{-1}=U
(UT)−1=U,
Q
=
d
i
a
g
(
λ
1
,
λ
2
,
⋯
,
λ
p
)
Q=diag(\lambda_1,\lambda_2,\cdots,\lambda_p)
Q=diag(λ1,λ2,⋯,λp) ,
Q
−
1
=
d
i
a
g
(
1
λ
1
,
1
λ
2
,
⋯
,
1
λ
p
)
Q^{-1}=diag(\frac{1}{\lambda_1},\frac{1}{\lambda_2},\cdots,\frac{1}{\lambda_p})
Q−1=diag(λ11,λ21,⋯,λp1)。
对
Σ
\Sigma
Σ求逆可得
Σ
−
1
=
(
U
Q
U
T
)
−
1
=
(
U
T
)
−
1
Q
−
1
U
−
1
=
U
Q
−
1
U
T
=
U
Λ
Λ
T
U
T
\Sigma^{-1}=(U Q U^T)^{-1}=(U^T)^{-1}Q^{-1}U^{-1}=UQ^{-1}U^T=U\Lambda\Lambda^T U^T
Σ−1=(UQUT)−1=(UT)−1Q−1U−1=UQ−1UT=UΛΛTUT
Λ
=
d
i
a
g
(
1
λ
1
,
1
λ
2
,
.
.
.
,
1
λ
p
)
\Lambda=diag(\frac{1}{\sqrt{\lambda_1}},\frac{1}{\sqrt{\lambda_2}},...,\frac{1}{\sqrt{\lambda_p}})
Λ=diag(λ11,λ21,...,λp1) 是对
Q
−
1
Q^{-1}
Q−1 的 cholesky 分解,同样也是对角矩阵,满足
Λ
T
=
Λ
\Lambda^T=\Lambda
ΛT=Λ。
代入
Σ
−
1
\Sigma^{-1}
Σ−1后再观察马氏距离
d
(
x
,
μ
)
d(x,\mu)
d(x,μ)
(
x
−
μ
)
T
Σ
−
1
(
x
−
μ
)
=
(
Λ
U
T
(
x
−
μ
)
)
T
(
Λ
U
T
(
x
−
μ
)
)
\sqrt{(x-\mu)^T\Sigma^{-1}(x-\mu)}=\sqrt{(\Lambda U^T(x-\mu))^T(\Lambda U^T(x-\mu))}
(x−μ)TΣ−1(x−μ)=(ΛUT(x−μ))T(ΛUT(x−μ))
其中
U
T
(
x
−
μ
)
U^T(x-\mu)
UT(x−μ) 可以理解为将数据点投影到每个特征向量上,形成了一个新的以特征向量(主成分)为基向量的坐标系。
新坐标系的样本集的协方差矩阵变为了
U
T
Σ
U
=
Q
U^T\Sigma U=Q
UTΣU=Q 。而
Λ
\Lambda
Λ 对角矩阵的作用是对坐标系进行缩放,缩放后样本集的协方差矩阵为
Λ
Q
Λ
T
=
I
\Lambda Q \Lambda^T=I
ΛQΛT=I。
因此变换后的样本集各个维度方差为1且各维度不相关。这个变换后的空间即规范化后的主成分空间。最后使用欧氏距离公式即可。