深度学习中的warm up

最新推荐文章于 2023-07-06 10:09:51 发布

lifeplayer_

最新推荐文章于 2023-07-06 10:09:51 发布

阅读量487

点赞数

分类专栏：深度学习基础文章标签：深度学习 pytorch

本文链接：https://blog.csdn.net/lifeplayer_/article/details/112852543

版权

深度学习基础专栏收录该内容

1 篇文章 0 订阅

订阅专栏

深度学习中的warm up

通俗解释

csdn博客

pytorch实现

warm up与consine learning rate

warm up最早来自于这篇文章：https://arxiv.org/pdf/1706.02677.pdf 。根据这篇文章，我们一般只在前5个epoch使用warm up。consine learning rate来自于这篇文章：https://arxiv.org/pdf/1812.01187.pdf 。通常情况下，把warm up和consine learning rate一起使用会达到更好的效果。代码实现：

# MultiStepLR without warm up
scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, milestones=args.milestones, gamma=0.1)

# warm_up_with_multistep_lr
warm_up_with_multistep_lr = lambda epoch: epoch / args.warm_up_epochs if epoch <= args.warm_up_epochs else 0.1**len([m for m in args.milestones if m <= epoch])
scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=warm_up_with_multistep_lr)

# warm_up_with_cosine_lr
warm_up_with_cosine_lr = lambda epoch: epoch / args.warm_up_epochs if epoch <= args.warm_up_epochs else 0.5 * ( math.cos((epoch - args.warm_up_epochs) /(args.epochs - args.warm_up_epochs) * math.pi) + 1)
scheduler = torch.optim.lr_scheduler.LambdaLR( optimizer, lr_lambda=warm_up_with_cosine_lr)

上面的三段代码分别是不使用warm up+multistep learning rate 衰减、使用warm up+multistep learning rate 衰减、使用warm up+consine learning rate衰减。代码均使用pytorch中的lr_scheduler.LambdaLR自定义学习率衰减器。

其中用到的LambdaLR的具体用法如下：

https://butui.me/post/lamdalr-in-pytorch/

Reference

pytorch实现参考博客

lifeplayer_

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习中的warm up

深度学习中的warm up通俗解释csdn博客pytorch实现warm up与consine learning ratewarm up最早来自于这篇文章：https://arxiv.org/pdf/1706.02677.pdf 。根据这篇文章，我们一般只在前5个epoch使用warm up。consine learning rate来自于这篇文章：https://arxiv.org/pdf/1812.01187.pdf 。通常情况下，把warm up和consine learning rate一
复制链接

扫一扫