对机器学习中的协方差矩阵还是傻傻的搞不清楚？这次我终于捋明白了！

最新推荐文章于 2024-01-07 02:09:42 发布

不一样的天蝎座

最新推荐文章于 2024-01-07 02:09:42 发布

阅读量935

点赞数 2

分类专栏：智能计算数学基础文章标签：协方差矩阵机器学习随机变量样本计算对称矩阵

本文链接：https://blog.csdn.net/mr____cheng/article/details/120791496

版权

智能计算数学基础专栏收录该内容

6 篇文章 3 订阅

订阅专栏

一、数学中`协方差矩阵`的前世今生

1、前世
（1）随机变量 $X$ 的2阶中心距： $E$ { $X-E(X)]^2$ }
（2）随机变量 $X 和 Y$ 的2阶混合中心距： $E$ { $[X - E (X)] [Y - E (Y)]$ }
2、今生
协方差矩阵由2阶中心距和2阶混合中心距共同定义。
（1）二维变量的协方差矩阵
设二维随机变量（ $X_1,X_2$ ），可得到四个2阶中心距，分别为：
$c_{11}$ = $E$ { $X_1-E(X_1)]^2$ }
$c_{12}$ = $E$ { $X_1-E(X_1)][X_2-E(X_2)]$ }
$c_{21}$ = $E$ { $X_2-E(X_2)][X_1-E(X_1)]$ }
$c_{22}$ = $E$ { $X_2-E(X_2)]^2$ }
由 $c_{11}$ ， $c_{12}$ ， $c_{21}$ ， $c_{22}$ 共同组成的矩阵 $C$ ，称为二维随机变量（ $X_1,X_2$ ）的协方差矩阵。 $C$ 的形式如下：
$C=\left( \begin{matrix} c_{11}& c_{12} \\ c_{21}& c_{22} \end{matrix} \right)$
（2） $n$ 维协方差矩阵
将二维随机变量的协方差矩阵进行推广，设 $n$ 维随机变量（ $X_1,X_2,...,X_n$ ）,可得到 $n \times n$ 个2阶中心距 $c_{ij}$ = $E$ { $X_i-E(X_i)][X_j-E(X_j)]$ }，其中 $i, j = 1, 2, . . ., n$ ，则称矩阵
$C=\left( \begin{matrix} c_{11}& c_{12} & \cdots &c_{1n} \\ c_{21}& c_{22}& \cdots &c_{2n} \\ \vdots& \vdots& \cdots &\vdots \\ c_{n1}& c_{n2}& \cdots &c_{nn} \end{matrix} \right)$
为 $n$ 维随机变量（ $X_1,X_2,...,X_n$ ）的协方差矩阵。
由于 $c_{ij}=c_{ji}$ ，显然，协方差矩阵是一个对称矩阵。

二、机器学习中的协方差矩阵

机器学习中模型的训练需要大量样本，在计算协方差矩阵时，一般先将样本拼成一个 $d \times N$ 维的矩阵 $X$ ={ $x_1,x_2,...,x_N$ }，其中 $d$ 为样本的维数， $N$ 为样本的个数， $x _k$ 表示一个样本。
计算样本均值 $x_0=\displaystyle\frac{1}{N}\sum_{i=k}^Nx_k$ 后，可得到 $d$ 维样本的协方差矩阵： $\Sigma_X=\displaystyle\frac{1}{N}\sum_{i=k}^N(x_k-x_0)(x_k-x_0)^T$
举例：
对于由5个样本组成的一个二维数据 $X=\left( \begin{matrix} -1& -1 & 0&2 &0\\ -2& 0& 0 &1 &1 \end{matrix} \right)$
显然，在这里 $x_1=\left( \begin{matrix} -1\\ -2 \end{matrix} \right),x_2=\left( \begin{matrix} -1\\ 0 \end{matrix} \right),x_3=\left( \begin{matrix} 0\\ 0 \end{matrix} \right),x_4=\left( \begin{matrix} 2\\ 1 \end{matrix} \right),x_5=\left( \begin{matrix} 0\\ 1 \end{matrix} \right),从而有x_0=\left( \begin{matrix} 0\\ 0 \end{matrix} \right)$
进一步求出该二维数据的协方差矩阵
在这里插入图片描述
通过以上计算过程可以看出，每个样本的计算过程都与数学中协方差矩阵的定义保持一致，eg：过程①，也即是说机器学习中协方差矩阵的计算和数学中协方差矩阵的定义保持一致。
事实上，以上计算过程等价于 $C=\displaystyle\frac{1}{5}XX^T=\frac{1}{5}\left( \begin{matrix} -1& -1 & 0&2 &0\\ -2& 0& 0 &1 &1 \end{matrix} \right)\left( \begin{matrix} -1& -2\\ -1& 0\\ 0& 0\\ 2& 1\\ 0& 1 \end{matrix} \right)=\left( \begin{matrix} \displaystyle\frac{6}{5} & & \displaystyle\frac{4}{5}\\ & & \\ \displaystyle\frac{4}{5}& & \displaystyle\frac{6}{5} \end{matrix} \right)$
总结：
机器学习中协方差矩阵的快速计算公式为：
$C=\displaystyle\frac{1}{N}XX^T$
其中， $N$ 为样本个数， $X$ 为大量样本拼成的 $d \times N$ 维矩阵。

不一样的天蝎座

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
对机器学习中的协方差矩阵还是傻傻的搞不清楚？这次我终于捋明白了！

一、数学中协方差矩阵的前世今生1、前世（1）随机变量XXX的2阶中心距：EEE{[X−E(X)]2[X-E(X)]^2[X−E(X)]2}（2）随机变量X和YX和YX和Y的2阶混合中心距：EEE{[X−E(X)][Y−E(Y)][X-E(X)][Y-E(Y)][X−E(X)][Y−E(Y)]}2、今生协方差矩阵由2阶中心距和2阶混合中心距共同定义。（1）二维变量的协方差矩阵设二维随机变量（X1,X2X_1,X_2X1,X2），可得到四个2阶中心距，分别为：c11c_{11}c11=EE
复制链接

扫一扫