滑动平均模型可以使模型在测试数据上更加健壮。仅用于测试数据。
shadow_variable = decay*shadow_variable+(1-decay)*variable
decay为衰减率, variable为待更新的变量。
decay=min(decay_base,(1+global_step)/(10+global_step))
decay越大模型越稳定,一般设置为0.999,,通过设置global_step,动态的设置decay的大小,使模型前期更新更快
variable_averages = tf.train.ExponentialMovingAverage(
MOVING_AVERAGE_DECAY, global_step)
variables_averages_op = variable_averages.apply(tf.trainable_variables())
tf.trainable_variables()为图上集合中未指定trainable=False的参数。
with tf.control_dependencies[variables_averages_op]):
train_op = tf.no_op(name='train')
sess.run(train_op)对影子变量进行更新。
优化之——滑动平均模型
最新推荐文章于 2024-03-05 08:48:36 发布