keras设置（自定义）学习率及优化器用法

噜噜啦啦咯

已于 2022-05-22 14:50:48 修改

阅读量1.3w

点赞数 24

分类专栏：深度学习 LSTM神经网络文章标签： python keras 深度学习 tensorflow

于 2022-03-23 11:49:51 首次发布

本文链接：https://blog.csdn.net/weixin_52910499/article/details/123680932

版权

深度学习同时被 2 个专栏收录

8 篇文章

订阅专栏

LSTM神经网络

3 篇文章

订阅专栏

默认学习率

自定义学习率

1. LearningRateScheduler

默认学习率

搭建keras模型的时候，没有制定学习率，效果不是特别理想，查询了优化器的默认学习率：

Adam是0.001，SGD是0.01

在Keras的Adam优化器中各参数如下：

keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=None, decay=0.0, amsgrad=False)

自定义学习率

自定义学习率可以通过回调函数实现。

1. LearningRateScheduler

参数

schedule：函数，该函数以epoch号为参数（从0算起的整数），返回一个新学习率（浮点数）

代码

import keras.backend as K
from keras.callbacks import LearningRateScheduler
 
def scheduler(epoch):
    # 每隔100个epoch，学习率减小为原来的1/10
    if epoch % 100 == 0 and epoch != 0:
        lr = K.get_value(model.optimizer.lr)
        K.set_value(model.optimizer.lr, lr * 0.1)
        print("lr changed to {}".format(lr * 0.1))
    return K.get_value(model.optimizer.lr)
 
reduce_lr = LearningRateScheduler(scheduler)
model.fit(train_x, train_y, batch_size=32, epochs=300, callbacks=[reduce_lr])

2. ReduceLROnPlateau

keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.1, patience=10, verbose=0, mode='auto', epsilon=0.0001, cooldown=0, min_lr=0)

当评价指标不在提升时，减少学习率

当学习停滞时，减少2倍或10倍的学习率常常能获得较好的效果。该回调函数检测指标的情况，如果在patience个epoch中看不到模型性能提升，则减少学习率

参数

monitor：被监测的量
factor：每次减少学习率的因子，学习率将以lr = lr*factor的形式被减少
patience：当patience个epoch过去而模型性能不提升时，学习率减少的动作会被触发
mode：‘auto’，‘min’，‘max’之一，在min模式下，如果检测值触发学习率减少。在max模式下，当检测值不再上升则触发学习率减少。
epsilon：阈值，用来确定是否进入检测值的“平原区”
cooldown：学习率减少后，会经过cooldown个epoch才重新进行正常操作
min_lr：学习率的下限

代码

from keras.callbacks import ReduceLROnPlateau
reduce_lr = ReduceLROnPlateau(monitor='val_loss', patience=10, mode='auto')
model.fit(train_x, train_y, batch_size=32, epochs=300, validation_split=0.1, callbacks=[reduce_lr])

优化器的用法

可以先实例化一个优化器对象，然后将它传入 model.compile()，像下面代码一样

from keras import optimizers
 
model = Sequential()
model.add(Dense(64, kernel_initializer='uniform', input_shape=(10,)))
model.add(Activation('softmax'))
 
sgd = optimizers.SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='mean_squared_error', optimizer=sgd)

或者可以通过名称来调用优化器，在这一种情况下，将使用优化器的默认参数。

model.compile(loss='mean_squared_error', optimizer='sgd')