滑动平均tf.train.ExponentialMovingAverage()

参考博客: https://blog.csdn.net/kuweicai/article/details/80517284

一、原理

shadow_variable = decay * shadow_variable + (1 - decay) * variable
shadow_variable是之前浅拷贝的旧值, variable是新值。

二、作用

  • 1、缓解模型训练时的振荡。
  • 2、在模型振荡频率较高的时候有较好的效果。

三、效果

use averaged parameters sometimes produce significantly better results than 
the final trained values

四、示例代码

tvars = tf.trainable_variables()             # 
opt = tf.train.AdamOptimizer(lr)
# Track the moving averages of all trainable variables.
variable_averages = tf.train.ExponentialMovingAverage(0.999, global_step)   # 

""下面的grads_and_vars其实已经把variable和grad打包zip在一起了""

apply_gradient_op = opt.apply_gradients(grads_and_vars, global_step)  
with tf.control_dependencies([apply_gradient_op]):      #
	train_op = variable_averages.apply(tvars)     # 

代码后带#的 是使用滑动平均所必需的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值