学点数学(4)-协方差矩阵

最新推荐文章于 2023-05-18 16:53:01 发布

小陈同学-陈百万

最新推荐文章于 2023-05-18 16:53:01 发布

阅读量482

点赞数

分类专栏：学点数学

本文链接：https://blog.csdn.net/sinat_40624829/article/details/104573319

版权

学点数学专栏收录该内容

11 篇文章 2 订阅

订阅专栏

协方差矩阵

协方差矩阵

（从随机变量讲起）
随机变量x：表示随机试验各种结果的实值单值函数，就是说随机变量x是一个函数映射，其取值为标量。

随机变量有离散型和连续型，离散型：抛10次硬币，硬币正面朝上的次数。连续型：某一地区一天内每一时刻的温度。

随机变量的性质由其统计量表示，常用的统计量有随机变量的：均值与方差

离散型随机变量x,取值序列 ${x_1,x_2,....,x_n\}$ 的均值为：
$\mu=\frac{1}{n}\sum_{i=1}^nx_i$
均值可以量化这个随机变量值大小。

离散型随机变量x,取值序列 ${x_1,x_2,....,x_n\}$ 的方差为：
$\sigma=\frac{1}{n}\sum_{i=1}^{n}(x_i-\mu)^2$
方差表明取值序列的 离散程度。

当分析两个随机变量x,y之间关系的时候，协方差 的概念由此引出:
两个随机变量取值序列 ${x_1,x_2,....,x_n\}$ , ${y_1,y_2,....,y_n\}$ 之间的协方差：
$cov(x,y)=\frac{1}{n}\sum_{i=1}^n(x_i-\mu_x)(y_i-\mu_y)$

协方差矩阵

我们在实际中，经常会遇到协方差矩阵，给定一个n个 $d * 1$ 维的(列)向量数据 $\{\bm{x_1},\bm{x_2},...,\bm{x_n}\}$ ,这组数据的协方矩阵为:
$\Sigma=\frac{1}{n}\sum_{i=1}^n（\bm{x_i}-\bm{\mu}）(\bm{x_i}-\bm{\mu})^T$
其中： $\bm{\mu}=\frac{1}{n}\sum\bm{x_i}$

以上协方差矩阵 $\Sigma$ 实际是记录以向量 $\bm{x}$ 各个（d个）维度为随机变量的d个随机变量之间的协方差。

$\bm{x}_i^j$ 下标表示第 $i$ 个向量数据，上标表示第 $i$ 个向量的第 $j$ 个分量，则 $\Sigma$ 是一个 $d * d$ 的矩阵：
$\Sigma=\frac{1}{n}\sum \left[ \begin{matrix} \bm{x_i^1}-\bm{\mu^1}\\ \bm{x_i^2}-\bm{\mu^2}\\ ...\\ \bm{x_i^d}-\bm{\mu^d} \end{matrix} \right] * \left[ \begin{matrix} \bm{x_i^1}-\bm{\mu^1} ,& \bm{x_i^2}-\bm{\mu^2},& ...,& \bm{x_i^d}-\bm{\mu^d} \end{matrix} \right]$

$=\frac{1}{n}\sum \left[ \begin{matrix} ( \bm{x_i^1}-\bm{\mu^1})( \bm{x_i^1}-\bm{\mu^1}) ,&( \bm{x_i^1}-\bm{\mu^1})(\bm{x_i^2}-\bm{\mu^2}),&...,&( \bm{x_i^1}-\bm{\mu^1})(\bm{x_i^d}-\bm{\mu^d})\\ ( \bm{x_i^2}-\bm{\mu^2})( \bm{x_i^1}-\bm{\mu^1}) ,&( \bm{x_i^2}-\bm{\mu^2})(\bm{x_i^2}-\bm{\mu^2}),&...,&( \bm{x_i^2}-\bm{\mu^2})(\bm{x_i^d}-\bm{\mu^d})\\ ...\\ ( \bm{x_i^d}-\bm{\mu^d})( \bm{x_i^1}-\bm{\mu^1}) ,& ( \bm{x_i^d}-\bm{\mu^d})(\bm{x_i^2}-\bm{\mu^2}),&...,& ( \bm{x_i^d}-\bm{\mu^d})(\bm{x_i^d}-\bm{\mu^d})\\ \end{matrix} \right]$

在PCA 算法中就需要对样本协方差矩阵进行特征值分解。

小陈同学-陈百万

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
学点数学(4)-协方差矩阵

协方差矩阵协方差矩阵（从随机变量讲起）随机变量x：表示随机试验各种结果的实值单值函数，就是说随机变量x是一个函数映射，其取值为标量。随机变量有离散型和连续型，离散型：抛10次硬币，硬币正面朝上的次数。连续型：某一地区一天内每一时刻的温度。随机变量的性质由其统计量表示，常用的统计量有随机变量的：均值与方差离散型随机变量x,取值序列{x1,x2,....,xn}\{x_1,x_2,.......
复制链接

扫一扫

专栏目录