warmup lr+CosineAnnealingLR策略

最新推荐文章于 2024-09-03 09:12:36 发布

Wwwasabi

最新推荐文章于 2024-09-03 09:12:36 发布

阅读量7.4k

点赞数 9

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_28177803/article/details/109804981

版权

本文介绍了Warmup LR策略，即在网络训练初期使用较小学习率并线性增长到预设值。重点讨论了如何通过WarmUpLR(optimizer, iter_per_epoch * args.warm)来确定学习率提升的位置。如果将其置于epoch内step，则表示在args.warm个epoch内增长，若置于batch内step，则表示在args.warm*iter_per_epoch个step内增长。同时，文章指出初始化scheduler时未正确调用可能导致学习率始终为0，并提出了相应的解决方案。" 132649395,19694681,Qt框架插件开发：扩展功能详解,"['qt', '开发语言', '插件开发']

摘要由CSDN通过智能技术生成

warmup lr策略就是在网络训练初期用比较小的学习率，线性增长到初始设定的学习率。

大概就是下面这个趋势，从0上升到0.01，再按照正常的学习率调整策略训练。

import torch
from torch.optim.lr_scheduler import _LRScheduler


class WarmUpLR(_LRScheduler):
    """warmup_training learning rate scheduler
    Args:
        optimizer: optimzier(e.g. SGD)
        total_iters: totoal_iters of warmup phase
    """
    def __init__(self, optimizer, total_iters, last_epoch=-1):
        
        self.total_iters = total_iters
        super().__init__(optimizer, last_epoch)

    def get_lr(self):
        """we will use the first m batches, and set the learning
        rate to base_lr * m / total_iters

最低0.47元/天解锁文章

关注

9
点赞
踩
24

收藏

觉得还不错? 一键收藏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Wwwasabi CSDN认证博客专家 CSDN认证企业博客

码龄9年

3: 原创

25万+: 周排名

138万+: 总排名

1万+: 访问

: 等级

114: 积分

15: 粉丝

10: 获赞

21: 评论

37: 收藏

私信

关注

热门文章

最新评论

warmup lr+CosineAnnealingLR策略
qinqinqinyyds: 写的什么啊
warmup lr+CosineAnnealingLR策略
lizhijian111: 就算warm放在scheduler前面，warm初始化已经只是optimizer的学习率为0了，后面scheduler初始化后学习率还是0阿，即使输入使用step(epoch)也没用我觉得
warmup lr+CosineAnnealingLR策略
Kkkkkkk kkkkk: 你好，请问初始学习率从哪里给呢？
warmup lr+CosineAnnealingLR策略
Liekkas Kono: 这个可以从_LRScheduler的源码中看到，https://pytorch.org/docs/stable/_modules/torch/optim/lr_scheduler.html#:~:text=with%20_enable_get_lr_call(self)%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20if,else%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20values%20%3D%20self.get_lr()
warmup lr+CosineAnnealingLR策略
Liekkas Kono: 博主这个实现好机智，之前想的实现都是将原本的Scheduler与warmup结合在一起，那样会遇到一些继承的问题你这样实现，一下子就解决了这个问题

大家在看

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。