- 作图运行后得到黄线,由于仅平均了两天的温度,平均的数据太少,所以得到的曲线有更多的噪声,更有可能出现异常值,但是这个曲线能更快的适应温度变化,所以指数加权平均数经常被使用.
- 在统计学中,它常被称为指数加权移动平均值
2.4 理解指数加权平均
公式:
Vt=βVt−1+(1−β)θt
- β
- 为0.5时,得到的是黄线.
- 通过计算,我们发现0.910≈1e≈0.35
即有
(1−ϵ)1ϵ≈1e
优势
实际处理数据时,我们会使用以下公式:
- 内存代码仅仅占用一行数字而已,不断覆盖掉原有的V值即可,只占单行数字的存储和内存.虽然不是最精确的计算平均值的方法,但是相比于原有的计算平均值需要保存所有数据求和后取平均的方法效率更高和资源占用率大大减小.所以在机器学习中大部分采用指数加权平均的方法计算平均值.
2.5 指数加权平均的偏差修正
当我们取β=0.98
时,实际上我们得到的不是绿色曲线,而是紫色曲线,因为使用指数加权平均的方法在前期会有很大的偏差,为此我们引入了偏差修正的概念
指数加权平均公式:
Vt=βVt−1+(1−β)θt
带修正偏差的指数加权平均公式:
V̂ t=Vt1−βt=(βVt−1+(1−β)θt)1−βt
补充
在机器学习中,在计算指数加权平均数的大部分时候,大家不太在乎偏差修正,大部分宁愿熬过初始阶段,拿到具有偏差的估测,然后继续计算下去.
如果你关心初始时期的偏差,修正偏差能帮助你在早期获得更好的估测