tf.train.ExponentialMovingAverage

最新推荐文章于 2024-09-27 10:58:53 发布

dengwohuai4277

最新推荐文章于 2024-09-27 10:58:53 发布

阅读量85

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/guqiangjs/p/7808326.html

版权

import tensorflow as tf;

v1 = tf.Variable(0, dtype=tf.float32)
step = tf.Variable(tf.constant(0))
ema = tf.train.ExponentialMovingAverage(0.99, step)
maintain_average = ema.apply([v1])
with tf.Session() as sess:
    init = tf.global_variables_initializer()
    sess.run(init)
    # [0.0, 0.0]
    print(sess.run([v1, ema.average(v1)]))  # 初始的值都为0
    sess.run(tf.assign(v1, 5))  # 把v1变为5
    sess.run(maintain_average)
    # [5.0, 4.5]
    print(sess.run([v1, ema.average(v1)]))
    # decay=min(0.99, 1/10)=0.1, v1=0.1*0+0.9*5=4.5
    sess.run(tf.assign(step, 10000))  # steps=10000
    sess.run(tf.assign(v1, 10))  # v1=10
    sess.run(maintain_average)
    # [10.0, 4.5549998]
    print(sess.run([v1, ema.average(v1)]))
    # decay=min(0.99,(1+10000)/(10+10000))=0.99, v1=0.99*4.5+0.01*10=4.555
    sess.run(maintain_average)
    # [10.0, 4.6094499]
    print(sess.run([v1, ema.average(v1)]))

tf.train.ExponentialMovingAverage(decay, steps) 这个函数用于更新参数，就是采用滑动平均的方法更新参数。这个函数初始化需要提供一个衰减速率（decay），用于控制模型的更新速度。这个函数还会维护一个影子变量（也就是更新参数后的参数值），这个影子变量的初始值就是这个变量的初始值，影子变量值的更新方式如下：

shadow_variable = decay * shadow_variable + (1-decay) * variable

shadow_variable是影子变量，variable表示待更新的变量，也就是变量被赋予的值，decay为衰减速率。decay一般设为接近于1的数（0.99,0.999）。