马氏距离与协方差矩阵

最新推荐文章于 2022-01-01 16:21:43 发布

zhoucy163

最新推荐文章于 2022-01-01 16:21:43 发布

阅读量2.6k

点赞数

分类专栏：图像处理和计算机视觉

图像处理和计算机视觉专栏收录该内容

52 篇文章 1 订阅

订阅专栏

今天看到“马氏距离”的字眼，原来简单的认为是加权的欧氏距离，在wiki上查过之后发现原来想简单了，马氏距离能够描述不同维之间的关联性，其关键在于它用到了协方差矩阵，下面是wiki上的介绍：

--------------------------

在统计学与概率论中，协方差矩阵（或称共变异矩阵）是一个矩阵，其每个元素是各个向量元素之间的方差。这是从标量随机变量到高维度随机向量的自然推广。

假设X是以n个标量随机变量组成的列向量，

$X = \begin{bmatrix}X_1 \\ \vdots \\ X_n \end{bmatrix}$

并且μ_i 是其第i个元素的期望值, 即, μ_i = E(X_i)。协方差矩阵被定义的第i，j项是如下协方差：

$\Sigma_{ij} = \mathrm{cov}(X_i, X_j) = \mathrm{E}\begin{bmatrix} (X_i - \mu_i)(X_j - \mu_j) \end{bmatrix}$

即：

$\Sigma=\mathrm{E} \left[ \left( \textbf{X} - \mathrm{E}[\textbf{X}] \right) \left( \textbf{X} - \mathrm{E}[\textbf{X}] \right)^\top \right]$

$= \begin{bmatrix} \mathrm{E}[(X_1 - \mu_1)(X_1 - \mu_1)] & \mathrm{E}[(X_1 - \mu_1)(X_2 - \mu_2)] & \cdots & \mathrm{E}[(X_1 - \mu_1)(X_n - \mu_n)] \\ \ \mathrm{E}[(X_2 - \mu_2)(X_1 - \mu_1)] & \mathrm{E}[(X_2 - \mu_2)(X_2 - \mu_2)] & \cdots & \mathrm{E}[(X_2 - \mu_2)(X_n - \mu_n)] \\ \ \vdots & \vdots & \ddots & \vdots \\ \ \mathrm{E}[(X_n - \mu_n)(X_1 - \mu_1)] & \mathrm{E}[(X_n - \mu_n)(X_2 - \mu_2)] & \cdots & \mathrm{E}[(X_n - \mu_n)(X_n - \mu_n)] \end{bmatrix}$

矩阵中的第(i,j)个元素是X_i与X_j的协方差。这个概念是对于标量随机变量方差的一般化推广。

尽管协方差矩阵很简单，可它却是很多领域里的非常有力的工具。它能导出一个变换矩阵，这个矩阵能使数据完全去相关(decorrelation)。从不同的角度看，也就是说能够找出一组最佳的基以紧凑的方式来表达数据。(完整的证明请参考瑞利商)。这个方法在统计学中被称为主成分分析(principal components analysis)，在图像处理中称为Karhunen-Loève 变换(KL-变换)。

-----------------------------------

马氏距离是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的，表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系（例如：一条关于身高的信息会带来一条关于体重的信息，因为两者是有关联的）并且是尺度无关的(scale-invariant)，即独立于测量尺度。对于一个均值为 $\mu = ( \mu_1, \mu_2, \mu_3, \dots , \mu_p )^T$ 协方差矩阵为Σ的多变量向量 $x = ( x_1, x_2, x_3, \dots, x_p )^T$ ,其马氏距离为

$D_M(x) = \sqrt{(x - \mu)^T \Sigma^{-1} (x-\mu)}.\,$

马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为Σ的随机变量 $\vec{x}$ 与 $\vec{y}$ 的差异程度:

$d(\vec{x},\vec{y})=\sqrt{(\vec{x}-\vec{y})^T\Sigma^{-1} (\vec{x}-\vec{y})}.\,$

如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧式距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离'.

$d(\vec{x},\vec{y})= \sqrt{\sum_{i=1}^p {(x_i - y_i)^2 \over \sigma_i^2}},$

其中σ_i 是 x_i 的标准差.

zhoucy163

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
马氏距离与协方差矩阵

今天看到“马氏距离”的字眼，原来简单的认为是加权的欧氏距离，在wiki上查过之后发现原来想简单了，马氏距离能够描述不同维之间的关联性，其关键在于它用到了协方差矩阵，下面是wiki上的介绍：--------------------------在统计学与概率论中，协方差矩阵（或称共变异矩阵）是一个矩阵，其每个元素是各个向量元素之间的方差。这是从标量随机变量到高维度随机向量的自然推广。
复制链接

扫一扫