关于指数加权平均（一阶低通滤波）

路痴导航员

已于 2023-11-25 10:12:38 修改

阅读量1.4k

点赞数 4

分类专栏：其他文章标签：算法概率论机器学习

于 2022-09-14 23:08:15 首次发布

本文链接：https://blog.csdn.net/weixin_42918498/article/details/126843393

版权

其他专栏收录该内容

6 篇文章 3 订阅

订阅专栏

文章目录

关于指数加权平均，已经有很多珠玉在前，很多博主都写了很好的博客。不过如果不自己推导消化一下，感觉东西就不是自己的，所以还是写个博客记录一下学习过程以及一些思考。

指数加权平均数学表达式

指数加权平均公式如下，其中 $v_t$ 为当前时刻平均值， $v_{t-1}$ 为上一时刻平均值， $\theta_t$ 为当前时刻新数据， $\beta$ 小于1为权重系数。

$v_t=\beta v_{t-1}+(1-\beta)\theta_t$

有的也写成如下形式，其中 $\alpha=1-\beta$ ，区别不大：
$v_t=(1-\alpha)v_{t-1}+\alpha\theta_t$
$v_t=v_{t-1}+\alpha(\theta_t-v_{t-1}）$

按照上述计算方式，则：
$v_0=0$
$v_1=(1-\beta)\theta_1$
$v_2=\beta v_{1}+(1-\beta)\theta_2 =\beta (1-\beta)\theta_1+(1-\beta)\theta_2$
$v_3=\beta v_{2}+(1-\beta)\theta_3 =\beta^2 (1-\beta)\theta_1+\beta(1-\beta)\theta_2 +(1-\beta)\theta_3$
…
$v_t =(1-\beta)(\theta_t + \beta\theta_{t-1}+\beta^2 \theta_{t-2}+ +\beta^3\theta_{t-3}+...)$

指数加权平均原理及其物理意义

指数加权平均的计算结果 $v_t$ 可以看作是 $1/(1-\beta)$ 个数据的平均值，假设 $\beta=0.9$ ，即相当于计算10个数据的平均值。由此可知，如果 $\beta$ 越大，则平均的数据越多，加权平均值更平滑，时间延迟更严重。

在实际应用中，如果数据的采样时间间隔为 ${T}$ ，想对时间常数 $\tau$ 内的采样值进行平均，那么只需要设置 $\beta$ 满足 $1/(1-\beta)=\tau/{T}$ 。

那么为什么指数平均可以看作是 $1/(1-\beta)$ 个数据的平均值的平均值呢?

由于 $\beta$ 小于1，所以随着指数的增大， $\beta^n$ 越趋近于0，而一般认为当指数项衰减到 $\frac{1}{e}$ 就可以忽略不计。设 $\epsilon=1-\beta$ ，由于当 $\epsilon -> 0^+$ 时， $(1-\epsilon )^{\frac{1}{\epsilon}}->\frac{1}{e}$ ，因此