马氏距离

最新推荐文章于 2022-06-06 20:30:00 发布

sk_U238

最新推荐文章于 2022-06-06 20:30:00 发布

阅读量970

点赞数 2

分类专栏：其他

其他专栏收录该内容

9 篇文章 0 订阅

订阅专栏

原文地址

https://www.cnblogs.com/Weirping/articles/6613013.html

马氏距离与其推导

本文使用markdown编写，如有公式显示异常，可将正文复制到markdown编辑器查看

马氏距离就是用于度量两个坐标点之间的距离关系，表示数据的协方差距离。与尺度无关的(scale-invariant)，即独立于测量尺度。

基本思想（intuition）

如下图的过程（以两个维度作为例子），此例的数据重心为原点，P1,P2到原点的欧氏距离相同，但点P2在y轴上相对原点有较大的变异，而点P1在x轴上相对原点有较小的变异。所以P1点距原点的直观距离是比P2点的小的。

Mahalanobis distance img 1

马氏距离就是解决这个问题，它将直观距离和欧式距离统一。它先将数据不同维度上的方差统一（即各维度上的方差相同），此时的欧式距离就是直观距离。

Mahalanobis distance img 2

如图：统一方差后的图，P1到原点的距离小于P2。P1’到原点的欧式距离和P2的相同。** 以上所说的直观距离就是马氏距离 **。但是，如果不同维度之间具有相关性，则压缩的效果就不好了。如下图只在横向和纵向上压缩，则达不到上图的压缩效果。

Mahalanobis distance img 3

所以在F1方向和F2方向上压缩数据才能达到较好的效果。所以需要将原始的在X坐标系中的坐标表示在F坐标系中。然后再分别沿着坐标轴压缩数据。

所以，计算样本数据的马氏距离分为两个步骤：

坐标旋转
数据压缩
坐标旋转的目标：使旋转后的各个维度之间线性无关，所以该旋转过程就是主成分分析的过程。
数据压缩的目标：所以将不同的维度上的数据压缩成为方差都是1的的数据集。

推导过程

有一个原始的多维样本数据 Xn×m (m列，n行):

x 11 x 21 ⋮ x n 1 x 12 x 22 ⋮ x n 2 \dots \dots ⋱ \dots x 1 m x 2 m ⋮ x n m

其中每一行表示一个测试样本（共n个）；

X i

表示样本的第i个维度（共m个） Xi=(x1ix2i⋯xni)T Xi=(x1ix2i⋯xni)T，以上多为样本数据记为 X=(X1,X2⋯Xm) X=(X1,X2⋯Xm)。样本的总体均值为

μ X = (μ X 1, μ X 2 \dots μ X m)

。其协方差为：

Σ X = E {(X - μ X) T (X - μ X)} = 1 n (X - μ X) T (X - μ X)

协方差矩阵是在具有一组样本后，表示数据的各维度之间的关系的。其中n是样本的数量

假设将原始数据集 X 通过坐标旋转矩阵 U 旋转到新的坐标系统中得到一个新的数据集 F 。（其实 X 和 F 表示的是同一组样本数据集，只是由于其坐标值不同，为了易于区分用了两个字母表示）

F T = (F 1, F 2 \dots F m) T = U X T

新数据集 F 的均值记为 μF=(μF1,μF2⋯μFm) , μF=UμX

由于将数据集旋转后数据的各维度之间是不相关的，所以新数据集 F 的协方差矩阵 ΣF 应该为对角阵。
由于:

(F - μ F) T = U (X - μ X) T

(F - μ F) = (X - μ X) U T

所以：

Σ F = E {(F - μ F) T (F - μ F)} = 1 n (F - μ F) T (F - μ F) = 1 n U (X - μ X) T (X - μ X) U T = U Σ X U T = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ λ 1 λ 2 ⋱ λ m ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟

每个 λi−−√ 就是每个维度值方差。

由于 ΣX 是实对角阵，所以 U 是一个正交矩阵,

U T = U - 1

。（ ~~005-正交变化,EVD,SVD,PCA-原理详解及推导~~）

以上是准备知识，下面推导一个样本点 x=(x1,x2⋯xm) 到重心 μX=(μX1,μX2⋯μXm) 的马氏距离。等价于求点 f=(f1,f2⋯fm) 压缩后的坐标值到数据重心压缩后的坐标值 μF=(μF1,μF2⋯μFm) 的欧式距离。

d 2 (f, μ F) = (f 1 - μ F 1 λ 1 - - \sqrt) 2 + (f 2 - μ F 2 λ 2 - - \sqrt) 2 + \dots + (f m - μ F m λ m - - - \sqrt) 2 = (f 1 - μ F 1, f 2 - μ F 2 \dots f m - μ F m) ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ 1 λ 1 1 λ 2 ⋱ 1 λ m ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ f 1 - μ F 1 f 2 - μ F 2 ⋮ f m - μ F m ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ = (f - μ F) (U Σ X U T) - 1 (f - μ F) T = (x - μ X) U T (U Σ X U T) - 1 U (x - μ X) T = (x - μ X) U T U Σ X - 1 U T U (x - μ X) T = (x - μ X) Σ X - 1 (x - μ X) T

这就是马氏距离的的计算公式了。

如果 x 是列向量

d 2 = (x - μ X) T Σ X - 1 (x - μ X)

如果并把上文的重心点 μX=(μX1,μX2⋯μXm) 改为任意一个样本点 y ，则可以得到 x 和 y 两个样本点之间的马氏距离公式为：

d 2 = (x - y) T Σ X - 1 (x - y)

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。