指数移动平均(Exponential Moving Average)也叫权重移动平均(Weighted Moving Average),是一种给予近期数据更高权重的平均方法。
深度学习中的EMA
在深度学习的优化过程中,theta_t
是 t 时刻的模型权重weights,v_t
是 t 时刻的影子权重(shadow weights)。在梯度下降的过程中,会一直维护着这个影子权重,但是这个影子权重并不会参与训练。基本的假设是,模型权重在最后的n步内,会在实际的最优点处抖动,所以我们取最后n步的平均,能使得模型更加的鲁棒。
ref
https://zhuanlan.zhihu.com/p/68748778
https://www.cnblogs.com/wuliytTaotao/p/9479958.html
https://zhuanlan.zhihu.com/p/278403697