tensorflow框架基础——指数衰减学习率

本文探讨了在深度学习中学习率的重要性,特别是指数衰减学习率的概念。通过TensorFlow提供的`tf.train.exponential_decay`函数,解释了如何设置和使用指数衰减学习率,并给出了不同参数配置下学习率变化的示例,展示了学习率在训练过程中的动态调整效果。
摘要由CSDN通过智能技术生成

学习率表示了每一次更新参数的幅度大小。学习率过小,会导致待优化的参数收敛缓慢;学习率过大会导致待优化的参数在最小值附近波动,不收敛。

而指数衰减学习率,是指学习率随着训练轮数变化而动态更新。

用tensorflow的函数表示为:

learning_rate = tf.train.exponential_decay(LEARNING_RATE_BASE,global_step,LEARNING_RATE_STEP,LEARNING_RATE_DECAY,

staircase=True/False)

  •  LEARNING_RATE_BASE:学习率初始值;
  • global_step:记录了当前训练轮数,为不可训练型参数;
  • LEARNING_RATE_STEP:喂入多少轮BATCH_SZIE后,更新一次学习率,BATCH_SZIE是每一轮训练喂入的样本数;
  • LEARNING_RATE_DECAY:学习率衰减率;
  • staircase:=True时,表示global_step / LEARNING_RATE_STEP取整数,学习率阶梯形衰减;=False时,学习率会是一条平滑下降的曲线。

之前查阅资料指数衰减的公式为:

learning_rate =  LEARNING_RATE_BASE * LEARNING_RATE_DECAY * (global_step/LEARNING_RATE_STEP)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值