动态调整网络学习率

梦在黎明破晓时啊

已于 2023-06-14 21:05:36 修改

阅读量98

点赞数

分类专栏：深度学习/机器学习的相关知识概念文章标签：深度学习 pytorch

于 2023-06-14 00:35:31 首次发布

本文链接：https://blog.csdn.net/qq_39522016/article/details/131198910

版权

深度学习/机器学习的相关知识概念专栏收录该内容

26 篇文章 2 订阅

订阅专栏

学习过程资料的积累，防止原网址失效，网址搬运连接

在之前看论文，其实也有很多点说到这个问题（学习率的选择）。如果我们学习率设置的过小，会极大的降低模型收敛速度，从而大大增加了训练时间；如果学习率太大，可能导致参数在最优解来回震荡。但是当我们选定了一个合适的学习率的时候，经过多轮的训练后，可能会出现准确率震荡或loss不再下降等情况，说明之前设置的这个学习率现在已经不能满足模型调优的需求了。此时我们就可以通过一个适当的学习率衰减策略来改善这种现象，提高我们的精度。这种设置方式在pytorch被称为scheduler。

1、官方API

在训练神经网络过程中，学习率是最重要的超参数之一，Pytorch封装了下述包进行调整学习率。
lr_scheduler.LambdaLR

lr_scheduler.MultiplicativeLR

lr_scheduler.StepLR

lr_scheduler.MultiStepLR

lr_scheduler.ExponentialLR

lr_scheduler.CosineAnnealingLR

lr_scheduler.ReduceLROnPlateau

lr_scheduler.CyclicLR

lr_scheduler.OneCycleLR

lr_scheduler.CosineAnnealingWarmRestarts

2、使用官方的API
关于如何使用这些动态调整学习率的策略，参考下面代码。

# 选择一种优化器
optimizer = torch.optim.Adam(...)
# 选择上面提到的一种或多种动态调整学习率的方法
scheduler1 = torch.optim.lr_scheduler....
scheduler2 = torch.optim.lr_scheduler....
...
schedulern = torch.optim.lr_scheduler....
# 进行训练
for epoch in range(100):
train(...)
validate(...)
optimizer.step()
# 需要在优化器参数更新之后再动态调整学习率
scheduler1.step()
...
schedulern.step()
# 注：我们在使用官方给出的torch.optim.lr_scheduler时，需要将scheduler.step()放在scheduler.step()后使用

3、自定义scheduler


def adjust_learning_rate(optimizer,epoch):
 
　　　lr = args.lr * (0.1**(epoch//30)) #每三十轮学习率降低百分之十
　　　 for param_group in optimizer.param_groups:
　　　　　　param_group['lr'] = lr

我们再通过adjust_learning_rate函数定义，在训练过程中就可以调用我们的函数来实现学习率的动态变化

def adjust_learning_rate(optimizer,...):
...
optimizer = torch.optim.SGD(model.parameters(),lr = args.lr,momentum = 0.9)
for epoch in range(10):
train(...)
validate(...)
adjust_learning_rate(optimizer,epoch)