马氏距离(Mahalanobis Distance)

概念

马哈拉诺比斯距离 Mahalanobis Distance,简称马氏距离,是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

计算方法

假设某样本集服从均值为 μ \mu μ,协方差矩阵为 Σ \Sigma Σ 的高斯分布,则该空间上的任意一个点 x x x 到样本集均值 μ \mu μ 的马氏距离可以表示为
d ( x , μ ) = ( x − μ ) T Σ − 1 ( x − μ ) d(x,\mu)=\sqrt{(x-\mu)^T\Sigma^{-1}(x-\mu)} d(x,μ)=(xμ)TΣ1(xμ)

推算与证明

协方差矩阵 Σ \Sigma Σ 特征值分解
Σ = U Q U T \Sigma=U Q U^T Σ=UQUT
其中 U = [ u 1 , u 2 , . . . , u p ] U=[\textbf{u}_1,\textbf{u}_2,...,\textbf{u}_p] U=[u1,u2,...,up] 是由归一化后的特征列向量组成的正交矩阵,满足 U U T = E UU^T=E UUT=E U − 1 = U T U^{-1}=U^T U1=UT ( U T ) − 1 = U (U^T)^{-1}=U (UT)1=U Q = d i a g ( λ 1 , λ 2 , ⋯   , λ p ) Q=diag(\lambda_1,\lambda_2,\cdots,\lambda_p) Q=diag(λ1,λ2,,λp) Q − 1 = d i a g ( 1 λ 1 , 1 λ 2 , ⋯   , 1 λ p ) Q^{-1}=diag(\frac{1}{\lambda_1},\frac{1}{\lambda_2},\cdots,\frac{1}{\lambda_p}) Q1=diag(λ11,λ21,,λp1)
Σ \Sigma Σ求逆可得
Σ − 1 = ( U Q U T ) − 1 = ( U T ) − 1 Q − 1 U − 1 = U Q − 1 U T = U Λ Λ T U T \Sigma^{-1}=(U Q U^T)^{-1}=(U^T)^{-1}Q^{-1}U^{-1}=UQ^{-1}U^T=U\Lambda\Lambda^T U^T Σ1=(UQUT)1=(UT)1Q1U1=UQ1UT=UΛΛTUT

Λ = d i a g ( 1 λ 1 , 1 λ 2 , . . . , 1 λ p ) \Lambda=diag(\frac{1}{\sqrt{\lambda_1}},\frac{1}{\sqrt{\lambda_2}},...,\frac{1}{\sqrt{\lambda_p}}) Λ=diag(λ1 1,λ2 1,...,λp 1) 是对 Q − 1 Q^{-1} Q1 的 cholesky 分解,同样也是对角矩阵,满足 Λ T = Λ \Lambda^T=\Lambda ΛT=Λ
代入 Σ − 1 \Sigma^{-1} Σ1后再观察马氏距离 d ( x , μ ) d(x,\mu) d(x,μ)
( x − μ ) T Σ − 1 ( x − μ ) = ( Λ U T ( x − μ ) ) T ( Λ U T ( x − μ ) ) \sqrt{(x-\mu)^T\Sigma^{-1}(x-\mu)}=\sqrt{(\Lambda U^T(x-\mu))^T(\Lambda U^T(x-\mu))} (xμ)TΣ1(xμ) =(ΛUT(xμ))T(ΛUT(xμ))
其中 U T ( x − μ ) U^T(x-\mu) UT(xμ) 可以理解为将数据点投影到每个特征向量上,形成了一个新的以特征向量(主成分)为基向量的坐标系。
新坐标系的样本集的协方差矩阵变为了 U T Σ U = Q U^T\Sigma U=Q UTΣU=Q 。而 Λ \Lambda Λ 对角矩阵的作用是对坐标系进行缩放,缩放后样本集的协方差矩阵为 Λ Q Λ T = I \Lambda Q \Lambda^T=I ΛQΛT=I
因此变换后的样本集各个维度方差为1且各维度不相关。这个变换后的空间即规范化后的主成分空间。最后使用欧氏距离公式即可。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值