均值和方差递推公式

weixin_43630230

已于 2024-02-29 23:37:48 修改

阅读量1.1k

点赞数 24

文章标签：算法均值算法

于 2024-02-29 23:34:54 首次发布

本文链接：https://blog.csdn.net/weixin_43630230/article/details/136380480

版权

文章目录

前言
一、定义
- 均值
- 方差
二、递推公式
- 1.均值
- 2.方差
总结

前言

计算实时序列数据的均值和方差时，常使递推的方式，可以减少存储和降低计算复杂度( O(n)-> O(1) )。下面将给出递推公式和推导方法。

一、定义

均值

定义：给定一个包含n个样本的集合 X={X1, …Xn}，均值就是这个集合中所有元素和的平均值。

公式：
$\begin{aligned} &\mu = \frac{1}{n}\sum_{i =1}^{n}x_{i} \end{aligned}$

方差

定义：方差是各个数据与其算术平均数的离差平方和的平均数。

公式：
$\begin{aligned} &\sigma^{2} = \frac{1}{n}\sum_{i =1}^{n}(x_{i} - \mu )^{2} \end{aligned}$

备注：样本方差的分母是n-1。

二、递推公式

1.均值

令前n个样本的均值为： $\begin{aligned} &\mu_{n} = \frac{1}{n}\sum_{i =1}^{n}x_{i} \end{aligned} \tag{2.1}$

则，与前n-1个样本的均值的递推公式为：
$\begin{aligned} &\mu_{n} = \frac{1}{n}\sum_{i =1}^{n}x_{i} \\ &~~~ = \frac{1}{n}\left ( \sum_{i =1}^{n-1}x_{i} + x_{n} \right ) \\ &~~~ = \frac{1}{n}\left [ (n-1)\mu_{n-1} + x_{n} \right ] \\ &~~~ = \mu_{n-1} + \frac{1}{n}(x_{n} - \mu_{n-1} ) \end{aligned} \tag{2.2}$

2.方差

令前n个样本的方差为： $\begin{aligned} &\sigma^{2}_{n} = \frac{1}{n}\sum_{i =1}^{n}(x_{i} - \mu_{n} )^{2} \end{aligned} \tag{2.3}$

将(2.2)代入(2.3)，可得与前n-1个样本的方差的递推公式为：

$\begin{aligned} &\sigma^{2}_{n} = \frac{1}{n}\sum_{i =1}^{n}\left [(x_{i} - \mu_{n-1})-\frac{1}{n}(x_{n} - \mu_{n-1} ) \right ]^{2} \\ &~~~ = \frac{1}{n}\sum_{i =1}^{n}\left [(x_{i} - \mu_{n-1})^{2}+\frac{1}{n^{2} }(x_{n}- \mu_{n-1} )^{2} - \frac{2}{n}(x_{i} - \mu_{n-1})(x_{n} - \mu_{n-1} ) \right ]^{2} \\ &~~~ = \frac{1}{n}\sum_{i =1}^{n}(x_{i} - \mu_{n-1})^{2} + \frac{1}{n^{2} }(x_{n}- \mu_{n-1} )^{2} - \frac{2}{n^{2}}(x_{n} - \mu_{n-1} )\sum_{i =1}^{n}(x_{i} - \mu_{n-1})\\ &~~~ = \frac{n-1}{n}\sigma^{2}_{n-1} + \frac{n+1}{n^{2}}(x_{n}- \mu_{n-1} )^{2} - \frac{2}{n^{2}}(x_{n} - \mu_{n-1} )(x_{n} - \mu_{n-1} )\\ &~~~ = \frac{n-1}{n}\sigma^{2}_{n-1} + \frac{n-1}{n^{2}}(x_{n}- \mu_{n-1} )^{2} \end{aligned} \tag{2.4}$
式(2.4 ) 的推导第三行第3项到第四行第3项，具体推导可见式 ( 2.5 )
$\begin{aligned} &\sum_{i =1}^{n}(x_{i} - \mu_{n-1}) = \sum_{i =1}^{n}x_{i} - n\mu_{n-1} \\ &~~~~~~~~~~~~~~~~~~~~ = x_{n} + \sum_{i =1}^{n-1} x_{i} - n\mu_{n-1}\\ &~~~~~~~~~~~~~~~~~~~~ = x_{n} - \mu_{n-1} + \sum_{i =1}^{n-1} x_{i} - (n-1)\mu_{n-1} \\ &~~~~~~~~~~~~~~~~~~~~ = x_{n} - \mu_{n-1} \end{aligned}$