【Pytorch】训练过程中学习率变化的几种策略

一、问题背景

  我们往往在训练模型的时候,学习率不能是一成不变的,大的学习率收敛快,但可能出现过拟合的情况,难以达到最优点;小的学习率收敛较慢,耗时较长,但能将loss降得更低。
  因此训练全过程并不是使用一个固定值的学习速度,而是随着时间的推移让学习率动态变化,比如刚开始训练,离下山地点的最优值还很远,那么可以使用较大的学习率下的快一点,当快接近最优值时为避免跨过最优值,下山速度要放缓,即应使用较小学习率训练,具体情况下因为我们也不知道训练时的最优值。

二、解决方案

  一种比较经典的策略就是warmup策略,warmup顾名思义就是热身,即在刚刚开始训练时以很小的学习率进行训练,使得网络熟悉数据,随着训练的进行学习率慢慢变大,到了一定程度,以设置的初始学习率进行训练,模型稳定后学习率再慢慢变小;学习率变化过程:上升—>平稳—>下降;这样会使模型的收敛效果较好。

  所以在pytorch中具体的解决办法有:

# warmup的方法可以自己实现,这里介绍optim库中自带的scheduler方法
import torch.optim as optim
from torch.optim import lr_scheduler

'''
(1)等间隔调整学习率 StepLR

(2)按需调整学习率 MultiStepLR

(3)指数衰减调整学习率 ExponentialLR

(4)余弦退火调整学习率 CosineAnnealingLR

(5)自适应调整学习率 ReduceLROnPlateau

(6)自定义调整学习率 LambdaLR
'''
# 例如 StepLR
optimizer = optim.Adam(model.parameters(), lr=0.001)
scheduler1 = lr_scheduler.StepLR(optimizer, 5, 0.5) # 每过5个epoch,学习率乘以0.1 
# …… 其他方法的具体使用可以去搜索对应的函数说明文档
scheduler5 = lr_scheduler.ReduceLROnPlateau() # 这种方法则不受epoch的影响,取决于我们的参数的“min”、“max”和我们检测目标是loss还是acc。
scheduler6 = lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda epoch:1/(epoch+1))
  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
PyTorch学习衰减可以通过调整优化器的学习来实现。以下是一些常见的学习衰减策略的示例代码: 1. StepLR:每过一定数量的epochs,将学习乘以一个因子。 ``` from torch.optim.lr_scheduler import StepLR optimizer = torch.optim.SGD(model.parameters(), lr=0.1) scheduler = StepLR(optimizer, step_size=30, gamma=0.1) for epoch in range(100): train(...) validate(...) scheduler.step() ``` 2. MultiStepLR:在预定义的epochs处将学习乘以一个因子。 ``` from torch.optim.lr_scheduler import MultiStepLR optimizer = torch.optim.SGD(model.parameters(), lr=0.1) scheduler = MultiStepLR(optimizer, milestones=[30,80], gamma=0.1) for epoch in range(100): train(...) validate(...) scheduler.step() ``` 3. ExponentialLR:每个epoch将学习乘以一个指数。 ``` from torch.optim.lr_scheduler import ExponentialLR optimizer = torch.optim.SGD(model.parameters(), lr=0.1) scheduler = ExponentialLR(optimizer, gamma=0.95) for epoch in range(100): train(...) validate(...) scheduler.step() ``` 4. CosineAnnealingLR:使用余弦函数将学习从初始值降到最小值,然后再回升。 ``` from torch.optim.lr_scheduler import CosineAnnealingLR optimizer = torch.optim.SGD(model.parameters(), lr=0.1) scheduler = CosineAnnealingLR(optimizer, T_max=100) for epoch in range(100): train(...) validate(...) scheduler.step() ``` 这些是常见的学习衰减策略的示例,PyTorch还有更多可用的学习衰减策略。需要注意的是,要将scheduler.step()放在epoch循环的最后一行,以确保在每个epoch结束时更新学习

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

郝同学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值