关于样本协方差矩阵的简单推导

最新推荐文章于 2023-08-28 12:09:36 发布

Happy_code666

最新推荐文章于 2023-08-28 12:09:36 发布

阅读量8.4k

点赞数 4

分类专栏：数学随笔

本文链接：https://blog.csdn.net/Happy_code666/article/details/101716869

版权

数学随笔专栏收录该内容

1 篇文章 0 订阅

订阅专栏

数据样本中心化：

1、对一维随机变量 $x$ ，有n个观测样本 $\{ x^1,x^2,\cdots,x^n\}$ ，其样本均值(期望)可定义为：
$\mu_x={E}\left(x\right)=\frac1n\sum_{i=0}^nx^i$ 这样，中心化操作后的新样本为： $z^{i}=x^i-\mu_x$ ，并且 $\sum_i^nz^i=0$
2、对于m维随机变量（特征、属性），定义随机向量：
$\pmb x=\begin{bmatrix} x_1 \\ x_2 \\ \vdots\\ x_m \\ \end{bmatrix} ,\pmb x \in R^m,这里x_i 为第i个随机变量$ 这里，再对m个随机变量的n个观测样本 $\{\pmb x^i\in R^m|i=1,2,\cdots,n\}$ 定义样本矩阵：
$X=\begin{bmatrix} \pmb x^1 & \pmb x^2&\cdots & \pmb x^n \end{bmatrix}= \begin{bmatrix} x_1^1&x_1^2&\cdots&x_1^n\\ x_2^1&x_2^2&\cdots&x_2^n\\ \vdots&\vdots&\ddots&\vdots&\\ x_m^1&x_m^2&\cdots&x_m^n \end{bmatrix} ,X \in R^{m\times n}$
$x^i_j$ 表示第 $i$ 个样本在第 $j$ 个随机变量（特征、属性）上的取值。这样，定义均值向量：
$\pmb {\mu_x}=E(\pmb x)=\begin{bmatrix} E(x_1) \\ E(x_2 ) \\ \vdots\\ E( x_m) \\ \end{bmatrix} =\frac 1n\begin{bmatrix} \sum_i^nx_1^i\\ \sum_i^nx_2^i \\ \vdots\\ \sum_i^nx_m^i \\ \end{bmatrix}= \begin{bmatrix} \mu_{x_1} \\ \mu_{x_2} \\ \vdots\\ \mu_{x_m} \\ \end{bmatrix}$
中心化操作后新样本矩阵为：
$Z=\begin{bmatrix} \pmb z^1 & \pmb z^2&\cdots & \pmb z^n \end{bmatrix}= \begin{bmatrix} \pmb x^1-\pmb{ \mu_ x}& \pmb x^2-\pmb{ \mu_ x}&\cdots &\pmb x^n-\pmb{ \mu_ x}& \end{bmatrix}$ 然后有 $\sum_i^n\pmb z^i=\pmb 0$

样本协方差矩阵

1、对于两个一维随机变量 $x$ 和 $y$ 的协方差可定义为：
$E[(x-\mu _x)(y-\mu_y)]=\frac 1{n-1}\sum_i^n (x_i-\mu_x)(y_i-\mu_y)$ 若样本已提前中心化，即新样本 $z^{i}=x^i-\mu_x$ ， $u^{i}=x^i-\mu_y$ 并且 $\sum_i^nz^i=0$ , $\sum_i^n u^i=0$ ，带入上式得：
$E[(x-\mu _x)(y-\mu_y)]=\frac 1{n-1}\sum_i^n (x_i-\mu_x)(y_i-\mu_y)=\frac 1 {n-1}\sum_i^nz^iu^i$
2、对于多维随机向量 $\pmb x$ 的自协方差矩阵（通常机器学习里提到的样本协方差矩阵），它是根据向量外积定义的：
$E[(\pmb x-\pmb{\mu_x})(\pmb x-\pmb{\mu_x})^T]=\frac 1{n-1}\sum_i^n(\pmb x^i-\pmb{\mu_x})(\pmb x^i-\pmb{\mu_x})^T$ 同理若样本已中心化，则
$E[(\pmb x-\pmb{\mu_x})(\pmb x-\pmb{\mu_x})^T]=\frac 1{n-1}\sum_i^n(\pmb x^i-\pmb{\mu_x})(\pmb x^i-\pmb{\mu_x})^T=\frac 1{n-1}\sum_i^n\pmb z^i(\pmb z^i)^T=\frac 1{n-1}ZZ^T$ 注：分块矩阵乘法可得
$\sum_i^n\pmb z^i(\pmb z^i)^T= \begin{bmatrix} \pmb z^1&\pmb z^2&\cdots&\pmb z^n \end{bmatrix} \begin{bmatrix} (\pmb z^1)^T \\ (\pmb z^2)^T \\ \vdots\\ ( \pmb z^n)^T \\ \end{bmatrix}=ZZ^T$