滑动平均模型tensorflow实现
滑动平均模型让最后得到的密性在未知数据上更加健壮
1,初始化衰减率ema=tf.train.Exp htonentialMovingAverlage(0.99,step)
衰减率为min{(0.99,(1+step)/(10+step)=0.1}
2新建一个列表【】,执行这个操作,每次都会更新变量
Maintain_average_op=Ems.apply([v1])
import tensorflow as tf
# 定义一个变量用于计算滑动平均,这个变量的初始值为0,
# 注意这里的变量类型为tf.float32,应为需要计算的滑动平均的变量必须是实数
v1 = tf.Variable(0,dtype=tf.float32)
# 这里的step变量模拟神经网络中的迭代轮数,可以用于动态控制衰减率。
step = tf.Variable(0,trainable=False)
# 定义一个滑动平均的类(class),初始化时给定了衰减率0.99和控制衰减率的变量step
ema = tf.train.ExponentialMovingAverage(0.99, step)
# 定义一个更新变量滑动平均的操作。
# 这里需要给定一个列表[],每次执行这个操作时,这个列表的变量都会被更新。
maintain_averages_op = ema.apply([v1])
with tf.Session() as sess:
# 初始化所有变量
init_op = tf.global_variables_initializer()
sess.run(init_op)
# 通过ema.average(v1)获取滑动平均之后的变量取值。
# 在初始化之后v1和v1的滑动平均都为0
print(sess.run([v1,ema.average(v1)]))
# v1变量更新到5值
sess.run(tf.assign(v1,5))
# 更新v1的滑动平均值,衰减率为min{(0.99,(1+step)/(10+step)=0.1}=0.1
# 所以v1的滑动平均值会被更新为0.1*0+0.9*5 = 4.5
sess.run(maintain_averages_op)
# 更新step到10000
sess.run(tf.assign(step,10000))
# 更新v1的值为10
sess.run(tf.assign(v1,10))
# 更新v1的滑动平均值,衰减率为min{0.99,(1+step)/(10+step)≈0.999}=0.99
# 所以v1的滑动平均会被更新为0.99*4.5+0.01*10=4.555
sess.run(maintain_averages_op)
print(sess.run([v1,ema.average(v1)]))
# 再次更新滑动平均值,得到新的滑动平均值0.99*4.555+0.01*10+4.609045
sess.run(maintain_averages_op)
print(sess.run([v1,ema.average(v1)]))