Tensorflow中提供tf.train.ExponentialMovingAverage函数实现(滑动平均模型)

本文介绍了如何在TensorFlow中使用tf.train.ExponentialMovingAverage进行滑动平均模型的实现。该方法通过decay参数控制模型更新速度,并为每个变量创建对应的shadow variable,其值随变量更新而变化。ExponentialMovingAverage利用num_updates动态调整衰减率,以达到平滑模型的效果。
摘要由CSDN通过智能技术生成

初始化ExponentialMovingAverage:

      1.利用decay(衰减率),控制模型更新速度;2.为每一个变量付应一个shadow variable, 并且shadow variable的初始值为对应变量的初始值,而shadow variable的值会随着每次运行中相应变量发生更新而变化;shadow variable的值为:

shadow_variable = decay*shadow_variable+(1-decay)*variable  #variable为待更新的变量,decay为衰减率
由公式可得:decay决定模型的更新速度;

在ExponentialMovingAverage通过num_updates参数来动态实现decay的大小。

若在初始化中提供num_updates参数,则每次使用的衰减率为:

min = {decay,(1+num_updates)/(10+num_updates))}

import tensorflow as tf
v1 = tf.Variable(0,dtype=tf.float32)  #定义一个变量,初始值为0
step = tf.Variable(0,trainable=False)  #step为迭代轮数变量,控制衰减率
ema = tf.train.ExponentialMovingAverage(0.99,step) #初始设定衰减率为0.99
maintain_averages_op = ema.apply([v1])             #更新列表中的变量
with tf.Session() as sess:
     init_op = tf.initialize_all_variables()       #初始化所有变量
sess.run(init_op)                                  
print(sess.run([v1,ema.average(v1)]))              #输出初始化后变量v1的值和v1的滑动平均值
sess.run(tf.assign(v1,5))                          #更新v1的值
sess.run(maintain_averages_op)                     #更新v1的滑动平均值
print(sess.run([v1,ema.average(v1)]))
sess.run(tf.assign(step,10000))                    #更新迭代轮转数step
sess.run(tf.assign(v1,10))                         
sess.run(maintain_averages_op)
print(sess.run([v1,ema.average(v1)]))              
                                                   #再次更新滑动平均值,
sess.run(maintain_averages_op)
print(sess.run([v1,ema.average(v1)]))
                                                   #更新v1的值为15
sess.run(tf.assign(v1,15))

sess.run(maintain_averages_op)
print(sess.run([v1,ema.average(v1)]))






评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值