Tensorflow中tf.train.exponential_decay函数(指数衰减法)

在Tensorflow中,为解决设定学习率(learning rate)问题,提供了指数衰减法来解决。

通过tf.train.exponential_decay函数实现指数衰减学习率。

步骤:1.首先使用较大学习率(目的:为快速得到一个比较优的解);

             2.然后通过迭代逐步减小学习率(目的:为使模型在训练后期更加稳定);

代码实现:

  1. decayed_learning_rate=learining_rate*decay_rate^(global_step/decay_steps)  
其中,decayed_learning_rate为每一轮优化时使用的学习率;

           learning_rate为事先设定的初始学习率;

           decay_rate为衰减系数;

           decay_steps为衰减速度。

而tf.train.exponential_decay函数则可以通过staircase(默认值为False,当为True时,(global_step/decay_steps)则被转化为整数) ,选择不同的衰减方式。

代码示例:

  1. global_step = tf.Variable(0)  
  2.   
  3. learning_rate = tf.train.exponential_decay(0.1, global_step, 100, 0.96, staircase=True)     #生成学习率  
  4.   
  5. learning_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(....., global_step=global_step)  #使用指数衰减学习率  

learning_rate:0.1;staircase=True;则每100轮训练后要乘以0.96.

通常初始学习率,衰减系数,衰减速度的设定具有主观性(即经验设置),而损失函数下降的速度与迭代结束之后损失的大小没有必然联系,

所以神经网络的效果不能单一的通过前几轮损失函数的下降速度来比较。

tf.train.exponential_decay(learning_rate, global_, decay_steps, decay_rate, staircase=True/False)

例如:

  1. import tensorflow as tf;  
  2. import numpy as np;  
  3. import matplotlib.pyplot as plt;  
  4.   
  5. learning_rate = 0.1  
  6. decay_rate = 0.96  
  7. global_steps = 1000  
  8. decay_steps = 100  
  9.   
  10. global_ = tf.Variable(tf.constant(0))  
  11. c = tf.train.exponential_decay(learning_rate, global_, decay_steps, decay_rate, staircase=True)  
  12. d = tf.train.exponential_decay(learning_rate, global_, decay_steps, decay_rate, staircase=False)  
  13.   
  14. T_C = []  
  15. F_D = []  
  16.   
  17. with tf.Session() as sess:  
  18.     for i in range(global_steps):  
  19.         T_c = sess.run(c,feed_dict={global_: i})  
  20.         T_C.append(T_c)  
  21.         F_d = sess.run(d,feed_dict={global_: i})  
  22.         F_D.append(F_d)  
  23.   
  24.   
  25. plt.figure(1)  
  26. plt.plot(range(global_steps), F_D, 'r-')  
  27. plt.plot(range(global_steps), T_C, 'b-')  
  28.       
  29. plt.show()  


分析:

初始的学习速率是0.1,总的迭代次数是1000次,如果staircase=True,那就表明每decay_steps次计算学习速率变化,更新原始学习速率,如果是False,那就是每一步都更新学习速率。红色表示False,绿色表示True。


结果:


  • 12
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值