深度学习高阶篇----学习率调度

最新推荐文章于 2024-04-20 14:16:56 发布

普普通通研究生学代码

最新推荐文章于 2024-04-20 14:16:56 发布

阅读量941

点赞数 1

分类专栏： python算法合集文章标签：深度学习学习 keras

本文链接：https://blog.csdn.net/weixin_47324594/article/details/124614607

版权

python算法合集专栏收录该内容

4 篇文章 8 订阅

订阅专栏

深度学习高阶篇----学习率调度

交流学术思想，加入Q群号：815783932

找到一个好的学习率非常重要，设置过高，会导致训练发散，设置过低，会导致收敛到最优解，但是花费时间刚长，更新较慢。

1、幂调度

将学习率设置为迭代次数t的函数，公式如下：
在这里插入图片描述
其中初始学习率是η0，幂c一般设置为1，步骤s为超参数。根据迭代次数t可知，每一次epoch都会下降，下降为一开始迅速下降，最后越来越慢。
利用keras 实现幂调度十分简单。

##幂调度
optimizer=keras.optimizers.SGD(learning_rate=0.001,decay=1e-4)

decay是超参数s的倒数，其中c默认为1。

2、指数调度

在这里插入图片描述
由上方公式可以看出，每经过s步将逐渐下降10倍，不同于幂调度，他是每次都降低10倍。

##指数调度
def exp_decay_fn(epoch):
    return 0.01*0.1**(epoch/20)

##若想使S 和初始化学习率 可以自己编写 则可写成下面编码方式
def exponential_decay(lr0,s):
    def exponential_decay_fn(epoch):
        return lr0*0.1**(epoch/20)
    return exponential_decay_fn

exponential_decay_fn=exponential_decay(lr0=0.001,s=20)

lr_scheduler=keras.callbacks.LearningRateScheduler(exponential_decay_fn)
history=model.fit(x_train,y_train,[...],callbacks=[lr_scheduler])

通过回调函数根据epoch 控制学习率的变化。

3、分段恒定调度（最常见最宜控制的）

##解决分段恒定调度 学习率
def priecewise_constant_fn(epoch):
    if epoch<5:
        return 0.01
    elif epoch<15:
        return 0.005
    else:
        return 0.001


lr_scheduler = keras.callbacks.LearningRateScheduler(priecewise_constant_fn)
history=model.fit(model_input, model_output, epochs=928, batch_size=5,callbacks=[lr_scheduler])

通过设定epoch数值的范围来控制，学习率参数的大小，这是我们做实验中最常见的一种方式。

4、性能调度（个人最常用的调度算法）

用下方回调函数时，其中factor=0.5，patience=5。表示每当联系5个轮次的最好验证损失还没有得到改善的时候，会将学习率乘以0.5。官方文档如下：https://tensorflow.google.cn/api_docs/python/tf/keras/callbacks/ReduceLROnPlateau

lr_scheduler = keras.callbacks.ReduceLROnPlateau(factor=0.5, patience=5)

普普通通研究生学代码

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
1
评论
深度学习高阶篇----学习率调度

深度学习高阶篇----学习率调度交流学术思想，加入Q群号：815783932找到一个好的学习率非常重要，设置过高，会导致训练发散，设置过低，会导致收敛到最优解，但是花费时间刚长，更新较慢。1、幂调度将学习率设置为迭代次数t的函数，公式如下：其中初始学习率是η0，幂c一般设置为1，步骤s为超参数。根据迭代次数t可知，每一次epoch都会下降，下降为一开始迅速下降，最后越来越慢。利用keras 实现幂调度十分简单。##幂调度optimizer=keras.optimizers.SGD(le
复制链接

扫一扫