pytorch实现学习率衰减的方法总结

最新推荐文章于 2024-08-12 07:57:32 发布

原创

最新推荐文章于 2024-08-12 07:57:32 发布 · 6.4k 阅读

24 ·

CC 4.0 BY-SA版权

本文详细介绍了PyTorch中torch.optim.lr_scheduler模块提供的六种学习率调整方法，包括StepLR、MultiStepLR、ExponentialLR、CosineAnnealingLR、ReduceLROnPlateau和LambdaLR，分别阐述了它们的参数设置、使用场景及代码示例。

前言：

之前在训练模型时一直使用自定义的学习率衰减函数，如下所示：

def adjust_learning_rate(args, optimizer, epoch, gamma=0.1):
    """Sets the learning rate to the initial LR decayed 0.1 every 50 epochs"""
    lr = args.lr * (0.1 ** (epoch // 50))
    for param_group in optimizer.param_groups:
        param_group['lr'] = lr

然后在每个epoch训练前调用一次，实现学习率的衰减：

    for epoch in range(args.start_epoch, args.epochs):
        adjust_learning_rate(args, optimizer, epoch, gamma=0.1)
        ......

后来发现pytorch也像tensorflow一样实现了很多学习率调整的方法，并封装在了torch.optim.lr_scheduler模块中，接下来对这些方法进行一下总结。

1. torch.optim.lr_scheduler.StepLR

* step_size (int): 学习率的衰减周期，单位是epoch。

* gamma(float): 学习率衰减的乘积因子，默认为0.1。

* 说明：等间隔的学习率衰减，每训练step_size个epoch，将学习率调整为lr=lr*gamma。

使用示例如下：

# Assuming optimizer uses lr = 0.05 for all groups
# lr = 0.05

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

潜行隐耀

关注关注

4
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

TensorFlow2.0学习笔记-5.数据构建

ruoqi23的博客

08-06

1485

5.数据构建 tf.data简介面对一堆格式不一的原始数据文件？读入程序的过程往往十分繁琐？运行的效率上不尽如人意？ T e n so r F l ow提供了tf.data这一模块，包括了一套灵活的数据集构建API，能够帮助我们快速、高效地构建数据输入的流水线，尤其适用于数据量巨大的场景。 tf.data包含三个类： • tf.data.Dataset类 • tf.data.TFRecordDataset类 • tf.data.TextLineDataset类 5.1.Da...

在pytorch中load超大训练数据

joey周琦

12-21

2661

在pytorch中load超大训练数据 by joeyqzhou 相关代码地址: https://github.com/joeyqzhou/blog/tree/master/pytorch%E4%B8%ADload%E8%B6%85%E5%A4%A7%E8%AE%AD%E7%BB%83%E6%95%B0%E6%8D%AE 最简单方式: 1 单线程获取数据到内存中 2 train的过程 for epoch in range(num_epochs): for i in range(i

参与评论您还未登录，请先登录后发表或查看评论

知识蒸馏：《Distilling the Knowledge in a Neural Network》算法介绍及PyTorch代码实例

weixin_44808161的博客

08-02

3093

知识蒸馏开山之作《Distilling the Knowledge in a Neural Network》算法介绍及PyTorch代码实例

pytorch深度学习实战lesson9

weixin_48304306的博客

11-09

2321

线性回归从零开始和简洁版实现

深度学习数据集生成函数的创建与使用

a_Loki的博客

06-29

1136

dataset和dataloader：通过生成数据的生成器或者保存数据的映射关系来避免数据的重复储存数据生成：我们自己生成含有一定规律的数据集，三个函数可以分别生成回归，分类，小批量随机的数据集，利用该数据集，实现一些简单的模型回归模型（手动创建）：快速实现（调库）：......

PyTorch使用Tricks：学习率衰减！！

不要给自己设限，尝试更多可能（思所向皆可往）

02-17

2847

在训练神经网络时，如果学习率过大，优化算法可能会在最优解附近震荡而无法收敛；如果学习率过小，优化算法的收敛速度可能会非常慢。因此，一种常见的策略是在训练初期使用较大的学习率来快速接近最优解，然后逐渐减小学习率，使得优化算法可以更精细地调整模型参数，从而找到更好的最优解。学习率按照指数的形式衰减，每次乘以一个固定的衰减系数，可以使用类来实现，需要指定优化器和衰减系数。学习率每隔一定步数（或者epoch）就减少为原来的一定比例，可以使用类来实现，需要指定优化器、步长和衰减比例。

图解Pytorch学习率衰减策略（一）

最新发布

xian0710830114的专栏

08-12

2398

在深度学习中，学习率是一个非常重要的超参数，它控制了模型在每次权重更新时的步长。学习率衰减策略是指在训练过程中逐步减少学习率，从而使得模型更稳定地收敛到最优解。本文将介绍：LinearLR、StepLR、MultiStepLR、ExponentialLR、CosineAnnealingLR、ReduceLROnPlateau、OneCycleLR

pytorch各种学习率衰减器

bettii的博客

05-29

419

pytorch实现查看当前学习率

09-16

本文将详细讲解如何在PyTorch中查看和管理学习率，包括动态调整学习率以及针对不同层设置不同的学习率。首先，要查看当前的学习率，可以访问优化器（optimizer）的状态字典。假设你已经定义了一个优化器，如SGD或...

Pytorch学习第三讲：训练网络

Vivianyzw的博客

07-09

1470

Pytorch官网也给了训练网络实例：for epoch in range(2): # loop over the dataset multiple times running_loss = 0.0 for i, data in enumerate(trainloader, 0): # get the inputs inputs, labels =...

pointnet train函数第二十七句 for epoch in range(MAX_EPOCH):

guyuezunting的专栏

06-29

6622

for epoch in range(MAX_EPOCH): log_string('**** EPOCH %03d ****' % (epoch)) sys.stdout.flush() train_one_epoch(sess, ops, train_writer) eval_one_epoch(sess, ops, test_writer) ...

Pytorch中的学习率衰减及其用法

开飞机的小毛驴儿

10-10

1万+

学习率衰减是一个非常有效的炼丹技巧之一，在神经网络的训练过程中，当accuracy出现震荡或loss不再下降时，进行适当的学习率衰减是一个行之有效的手段，很多时候能明显提高accuracy。 Pytorch中有两种学习率调整(衰减)方法：使用库函数进行调整；手动调整。 1. 使用库函数进行调整： Pytorch学习率调整策略通过 torch.optim.lr_sheduler 接口实现。pytorch提供的学习率调整策略分为三大类，分别是：（1）有序调整：等间隔调整(Step)，多间隔调整(M

《深度学习之pytorch实战计算机视觉》第10章循环神经网络（代码可跑通）

csdn_xmj的博客

05-09

1738

torch版本>='1.6.0'。循环神经网络（Recurrent Neural Network，简称RNN）是深度学习中重要的内容和我们之前使用的卷积神经网络有着同等重要的地位。循环神经网络主要被用于处理序列（Sequences）相关的问题，比如在自然语言领域应用循环神经网络的情况就较多；当然，也可以用于解决分类问题，虽然在图片特征的提取上没有卷积神经网络那样强大，但是本章仍然会使用循环神经网络来解决图片分类的问题，并主要讲解循环神经网络的工作机制和原理。

数据完全存于内存的数据集类+节点预测与边预测任务实践

weixin_43595036的博客

06-27

639

一、数据完全存于内存的数据集类 1. 引言对于占用内存有限的数据集，我们可以将整个数据集的数据都存储到内存里。PyG为我们提供了方便的构造数据完全存于内存的数据集类，简称为InMemory数据集类的方式。 2. 使用数据集的一般过程 PyG定义了使用数据的一般过程：从网络上下载数据原始文件；对数据原始文件做处理，为每一个图样本生成一个Data对象；对每一个Data对象执行数据处理，使其转换成新的Data对象；过滤Data对象；保存Data对象到文件；获取Data对象，在每一次获取Data对象

Pytorch:epoch保存和断点训练

weixin_44826288的博客

12-16

3666

如果模型比较大，在训练时可能会由于某些意外原因导致训练还没有完全完成就终止，对付这种情况，可以通过每隔一定数量的epoch就保存一次模型参数，下次如果出现训练终止的情况时，就可以加载最新的模型来恢复训练，而不用从头开始。从上次的断点处继续训练，笔者在这里列出两种方法，第一种是通过。来确定是否恢复训练；直接加载上次的断点路径。

Pytorch中几种调整学习率scheduler机制(策略)的用法即其可视化

对方正在输入中...

05-11

5589

申明此篇博文是以AlexNet为网络架构(其需要输入的图像大小为227x227x3)，CIFAR10为数据集，SGD为梯度下降函数举例。运行此程序时，文件的结构： /content/drive/MyDrive/coder/Simple-CV-Pytorch-master | | | |----AlexNet----train.py(train_adjust_learning_rate.py，train_MultiStepLR.py等等) | | | |----tensorboard(保存tensor

深度学习模型、数据集分割、训练、优化算法、模型解释

weixin_41733381的博客

05-28

1170

深度学习模型训练优化算法的主要特点和步骤

pytorch学习笔记(十):learning rate decay(学习率衰减)