tensorflow滑动平均模型ExponentialMovingAverage的使用

最新推荐文章于 2023-06-16 11:05:52 发布

阿童木-atom

最新推荐文章于 2023-06-16 11:05:52 发布

阅读量1.5w

点赞数 1

分类专栏：算法机器学习算法文章标签： tensorflow 滑动平均值 ExponentialMovingAverage

本文链接：https://blog.csdn.net/zhaojianting/article/details/80593189

版权

滑动平均模型能提升测试集或实际预测的准确性。ExponentialMovingAverage通过每批数据小幅度更新权重的影子变量实现。以衰减率decay为参数，影子变量的更新公式为：shadow_w = decay * shadow_w + (1-decay) * w。通常在训练中使用原始模型V1，仅在验证或预测时应用滑动平均值。实例展示表明，随着迭代次数增加，影子变量逐渐接近权重值。

摘要由CSDN通过智能技术生成

　　滑动平均模型可以在一定程度上提高最终模型在测试集或实际预测数据的准确性。神经网络中每层的参数矩阵Ｗ都建一个对应的影子变shade_w量，一般情况下每一批数据更新一次Ｗ，shade_w也会随着更新但更新的幅度小有W。影子变量更新值由下面的公式决定：
　　shadow_w = decay * shadow_w + (1-decay) * w
shadow_w的初始值就是w的初始值，decay是衰减率自己指定的参数，w是这次更新后的值。使用方法很简单，下面看下源码和便用方法

#构告函数
#decay必传的参数，一般是(0.9,1）
#num_updates可以控制decay的大小,min(decay, (1 + num_updates) / (10 + num_updates))
#zero_debias本人也没看太懂，反正是一般用不到的，应该是指避免数学上的一些错误，例如除0
  def __init__(self, decay, num_updates=None, zero_debias=False,
               name="ExponentialMovingAverage")

下面看一个例子