【数学与算法】协方差矩阵与 w*w^T 的关系_协方差矩阵公式为啥有个t-CSDN博客

本文链接：https://blog.csdn.net/u011754972/article/details/121641361

下面的二维向量 $\vec W$ 只是一个样本，对于多个样本才能谈论协方差，因为协方差和方差是求一系列样本的协方差和方差，单个样本并没有协方差这一说。

下面公式中的求 $w 1$ 的期望和方差，是求所有样本的 $\displaystyle\color{blue}w1$ 特征的期望和方差。

不过下面的 $\displaystyle\color{blue}\vec{W}\vec{W}^T$ 不叫协方差矩阵，因为各个特征(例如 $\displaystyle\color{blue}w1$ )没有减去平均值（又叫期望），只有减去平均值（期望）的之后才能叫协方差矩阵，除非期望为0,最后还得除以样本数目，才是协方差矩阵。
$\vec W = \begin{bmatrix} w1\\ w2\\ \end{bmatrix}$
那么对于 $w 1 和 w 2$ 期望为0的 $\displaystyle\color{blue}\vec{W}$ 协方差矩阵为：
$\displaystyle\color{blue}P = E(\vec{W}\vec{W}^T)$
注意，上面的协方差是对 $\displaystyle\color{blue}\vec{W}\vec{W}^T$ 求期望，并非 $\displaystyle\color{blue}协方差=\vec{W}\vec{W}^T$ 。

$\vec{W}\vec{W}^T= \begin{bmatrix} w1\\w2\\ \end{bmatrix} \begin{bmatrix} w1\ w2\\ \end{bmatrix} =\begin{bmatrix} w1^2&w1*w2\\\quad\\ w1*w2&w2^2\end{bmatrix}$

对上面等式求期望：
$E\begin{bmatrix} w1^2&w1*w2\\ w1*w2&w2^2\end{bmatrix} =\begin{bmatrix} E(w1^2)&E(w1*w2)\\\quad\\ E(w1*w2)&E(w2^2)\end{bmatrix}$

`协方差的完整求法：`

下面是n维特征，有m个样本：
在这里插入图片描述

方差的性质：
$\displaystyle\color{blue}Var(x) = E(x^2) - E^2(x) \tag{1}$
如果 $\displaystyle\color{blue}\vec W$ 的两个特征 $\displaystyle\color{blue}w1,w2$ 都服从正态分布，那么：
期望为0，即：
$\color{blue} \begin{cases} E(w1) = 0\\\\ E(w2) = 0 \end{cases}$
那么，可以得到：
$\color{blue} \begin{cases} Var(w1) = E(w1^2)\\\\ Var(w2) = E(w2^2) \end{cases}$
我们还可以求出 $\displaystyle\color{blue}w1,w2$ 的协方差：
$\displaystyle\color{blue}Cov(w1,w2) = E(w1*w2)$
因此：
$E(\vec{W}\vec{W}^T)=\begin{bmatrix} Var(w1)&Cov(w1,w2)\\\quad\\Cov(w1,w2)&Var(w2)\end{bmatrix} \tag{2}$

上面对等式求期望的那一步，其实就是求期望，只不过 $\displaystyle\color{blue}E(w1^2)$ 其实是对很多样本的 $\displaystyle\color{blue}w1$ 求期望，也就是除以样本数量。

`证明过程：`

下面是以三个样本为例求 $\displaystyle\color{blue}\vec{W}\vec{W}^T$ ，右上角标表示样本编号：
左边矩阵每列是一个样本,用左上角小括号标注，下面是3个样本。

$\vec{W}\vec{W}^T=\begin{bmatrix} w_1^{(1)}&w_1^{(2)}&w_1^{(3)}\\ w_2^{(1)}&w_2^{(2)}&w_2^{(3)}\\ \end{bmatrix} *\begin{bmatrix} w_1^{(1)}&w_2^{(1)}\\ w_1^{(2)}&w_2^{(2)}\\ w_1^{(3)}&w_2^{(3)}\end{bmatrix}=\\ \\\quad\\ \begin{bmatrix} (w_1^{(1)})^2+(w_1^{(2)})^2+(w_1^{(3)})^2 && w_1^{(1)}*w_2^{(1)}+w_1^{(2)}*w_2^{(2)}+w_1^{(3)}*w_2^{(3)}\\ \\\quad w_1^{(1)}*w_2^{(1)}+w_1^{(2)}*w_2^{(2)}+w_1^{(3)}*w_2^{(3)} && (w_2^{(1)})^2+(w_2^{(2)})^2+(w_2^{(3)})^2\end{bmatrix}$