指数加权平均与其偏差消除

指数加权平均

对于一个呈序列形式的数据集,一种统计并获得连续曲线的方法是指数加权平均。具体来讲,对于一个数据序列
θ 1 , θ 2 , ⋯   , θ m \theta_1,\theta_2,\cdots,\theta_m θ1,θ2,,θm
如果直接把这些点相连,得到的曲线会包含大量噪声,杂乱而无规律:
在这里插入图片描述
所以我们重新计算一下每个点的值,令
v 0 = 0 v 1 = β v 0 + ( 1 − β ) θ 1 ⋯ v i = β v i − 1 + ( 1 − β ) θ i ⋯ v m = β v m − 1 + ( 1 − β ) θ m v_0=0\\ v_1=\beta v_0+(1-\beta)\theta_1\\ \cdots\\ v_i=\beta v_{i-1}+(1-\beta)\theta_i\\ \cdots\\ v_m=\beta v_{m-1}+(1-\beta)\theta_m\\ v0=0v1=βv0+(1β)θ1vi=βvi1+(1β)θivm=βvm1+(1β)θm
通过该平均方法,我们实际上是对 1 ∼ i 1\sim i 1i的数据进行了加权平均,且权重从 i i i 1 1 1呈指数递减,越靠近当前索引所占的权重越高。一个经验的估计是 v i v_i vi大概代表着前 1 1 − β \frac{1}{1-\beta} 1β1个数据求平均,因为超过该范围的样本所占的权重已经比较小了。

参数 β \beta β影响的就是之前的样本所占权重的衰减速率, β \beta β越接近1,样本权重衰减就越慢,我们囊括的样本就越多,此时曲线会比较平滑,但不能及时反映出当前点产生的效应,通常会比较滞后。而KaTeX parse error: Undefined control sequence: \bata at position 1: \̲b̲a̲t̲a̲越接近0,样本权重衰减就越快,曲线就会波动更剧烈,但是对当前数据非常敏感,反应很及时。

下图为 β = 0.9 \beta=0.9 β=0.9(红色)和 β = 0.98 \beta=0.98 β=0.98(绿色)时我们得到的曲线:
在这里插入图片描述

偏差消除

在实际应用中,我们得到的曲线其实和上图的曲线还有一点偏差,如果 β = 0.98 \beta=0.98 β=0.98,我们实际得出的应该是紫色线:
在这里插入图片描述
这是因为在指数加权平均的前期,我们的初始值 v 0 = 0 v_0=0 v0=0还占据了很大的权重,使得曲线的前端都被拉低了,直到曲线的中后程, v 0 v_0 v0的权重衰减的足够低,紫色线才逐渐与绿色线重合。

想要避免这种情况,可以在之前的运算中再加上一项,得到
v i = β v i − 1 + ( 1 − β ) θ i 1 − β i v_i=\frac{\beta v_{i-1}+(1-\beta)\theta_i}{1-\beta^i} vi=1βiβvi1+(1β)θi
因为初始项 v 0 = 0 v_0=0 v0=0 v i v_i vi中所占的权重就是 β i \beta^i βi,所以除以 1 − β i 1-\beta^i 1βi就可以排除掉 v 0 v_0 v0带来的影响,得到一个合理的曲线。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ShadyPi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值