优化之——滑动平均模型

最新推荐文章于 2024-03-05 08:48:36 发布

zd_njupt

最新推荐文章于 2024-03-05 08:48:36 发布

阅读量918

点赞数

分类专栏： TensorFlow

本文链接：https://blog.csdn.net/zd_nupt/article/details/78985739

版权

TensorFlow 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

滑动平均模型可以使模型在测试数据上更加健壮。仅用于测试数据。
shadow_variable = decay*shadow_variable+(1-decay)*variable
decay为衰减率， variable为待更新的变量。

decay=min(decay_base,(1+global_step)/(10+global_step))

decay越大模型越稳定，一般设置为0.999，，通过设置global_step,动态的设置decay的大小，使模型前期更新更快

variable_averages = tf.train.ExponentialMovingAverage(
      MOVING_AVERAGE_DECAY, global_step)
variables_averages_op = variable_averages.apply(tf.trainable_variables())

tf.trainable_variables()为图上集合中未指定trainable=False的参数。 
with tf.control_dependencies[variables_averages_op]):
    train_op = tf.no_op(name='train')
sess.run(train_op)对影子变量进行更新。