PointRCNN作者代码中学习率的变化情况

作者用的是adam onecycle,使用了下面的配置。由于我不想只训练200个epoch rpn阶段,想多训练一些周期,于是自己调整了训练周期,但是这样做训练一段时间之后,学习率还是在上升的,这样肯定是不行的,因为一般训练结束的时候学习率是很小的。

分析学习率变化有两种方法,一种是理论分析,一种看代码分析,一种是试验分析。我采用最后者。但是如果真训练的话又会用太长时间。于是我就把训练的样本从几千个变成了1,这样1S左右一个epoch。

接下来我更改总的学习周期,更改DECAY_STEP_LIST等,看看学习率变化曲线是怎样的。

LR: 0.002
LR_CLIP: 0.00001
LR_DECAY: 0.5
DECAY_STEP_LIST: [100, 150, 180, 200]
LR_WARMUP: True
WARMUP_MIN: 0.0002
WARMUP_EPOCH: 1

下面是DECAY_STEP_LIST: [100, 150, 180, 200],epoches=200

 

下面是DECAY_STEP_LIST: [100, 150, 180, 200],epoches=200

可以看到好像和设置的 : [100, 150, 180, 200]没有关系,和设置的总训练周期有关系,先上升后下降。

现在改改[100, 150, 180, 200]中的数字个数试试。并没有什么卵用,不太清楚这里的作用。

猜想是训练方法的原因,如果不是adam_onecycle,可能这个列表就有用了。下面试试:

果然。。

DECAY_STEP_LIST: [10, 15, 18, 40] & epoches=100

LR_CLIP: 0.00001
LR_DECAY: 0.5
DECAY_STEP_LIST: [10, 15, 18, 20,25,27,28,29,30]
LR_WARMUP: True
WARMUP_MIN: 0.0002
WARMUP_EPOCH: 1

设置文件里面的这些参数应该都是为adam用的。

(一)、什么是Warmup?
Warmup是在ResNet论文中提到的一种学习率预热的方法,它在训练开始的时候先选择使用一个较小的学习率,训练了一些epoches或者steps(比如4个epoches,10000steps),再修改为预先设置的学习来进行训练。引用自学习率预热

 

LR: 0.002 代表最大的学习率。adam和adam_onecycle共用这个参数。

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
在PyTorch学习率衰减可以通过调整优化器的学习率来实现。以下是一些常见的学习率衰减策略的示例代码: 1. StepLR:每过一定数量的epochs,将学习率乘以一个因子。 ``` from torch.optim.lr_scheduler import StepLR optimizer = torch.optim.SGD(model.parameters(), lr=0.1) scheduler = StepLR(optimizer, step_size=30, gamma=0.1) for epoch in range(100): train(...) validate(...) scheduler.step() ``` 2. MultiStepLR:在预定义的epochs处将学习率乘以一个因子。 ``` from torch.optim.lr_scheduler import MultiStepLR optimizer = torch.optim.SGD(model.parameters(), lr=0.1) scheduler = MultiStepLR(optimizer, milestones=[30,80], gamma=0.1) for epoch in range(100): train(...) validate(...) scheduler.step() ``` 3. ExponentialLR:每个epoch将学习率乘以一个指数。 ``` from torch.optim.lr_scheduler import ExponentialLR optimizer = torch.optim.SGD(model.parameters(), lr=0.1) scheduler = ExponentialLR(optimizer, gamma=0.95) for epoch in range(100): train(...) validate(...) scheduler.step() ``` 4. CosineAnnealingLR:使用余弦函数将学习率从初始值降到最小值,然后再回升。 ``` from torch.optim.lr_scheduler import CosineAnnealingLR optimizer = torch.optim.SGD(model.parameters(), lr=0.1) scheduler = CosineAnnealingLR(optimizer, T_max=100) for epoch in range(100): train(...) validate(...) scheduler.step() ``` 这些是常见的学习率衰减策略的示例,PyTorch还有更多可用的学习率衰减策略。需要注意的是,要将scheduler.step()放在epoch循环的最后一行,以确保在每个epoch结束时更新学习率

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

York1996

您的打赏,是我更新的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值