pytorch基础（十六）----------学习率调整策略

Py零零

已于 2022-02-02 14:37:57 修改

阅读量1.9k

点赞数

分类专栏：计算机视觉文章标签： pytorch 深度学习

于 2022-01-29 15:48:57 首次发布

本文链接：https://blog.csdn.net/m0_55769743/article/details/122743562

版权

计算机视觉专栏收录该内容

18 篇文章 5 订阅

订阅专栏

学习率（lr），是用来空值更新的步伐，防止梯度爆炸。以打高尔夫球为例，在我们打第一杆的时候很难一杆进洞，所有需要一个比较大的力量去击球，当球离洞比较近时，就需要调整力的大小，轻轻地击球才能进洞。

学习率调整策略

代码展示：

import torch

# 选择优化器
optimizer = optim.SGD(net.parameters(), lr=LR)
# 设置学习率调整策略
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=10, gamma=0.1)       # step_size表示每是个epoch调整一次，公式为lr = lr * gamma

# 使用，需要放入epoch迭代循环中
scheduler.step()

pytorch中的学习率调整方法

1、torch.optim.lr_scheduler.StepLR（）

功能：等间隔调整学习率
主要参数：
step_size：调整间隔数
gamma：调整系数
调整公式： $l r = l r * g a m m a$

2、torch.optim.lr_scheduler.MultiStepLR（）

功能：按照给定间隔调整学习率
主要参数：
milestones：设定调整时刻数，可以是一个列表
gamma：调整系数
调整公式： $l r = l r * g a m m a$

3、torch.optim.lr_scheduler.ExponentialLR（）

功能：按指数衰减调整学习率，每次迭代都会进行调整
主要参数：
gamma：调整系数
调整公式： $l r = l r * （ g a m m a * * e p o c h ）$

4、torch.optim.lr_scheduler.CosineAnnealingLR（）

功能：余弦周期调整学习率
主要参数：
T_max：下降周期，等于周期的一半
eta_min：学习率下限，下降周期的下限
调整公式： $η_t=η_{min}+\frac{1}{2}(η_{max}-η_{min})(1+cos(\frac{T_{cur}}{T{max}}π))$

5、torch.optim.lr_scheduler.ReduceLRonPlateau（）

功能：监控指标，当指标不再发生变化则调整
主要参数：
mode：min/max两种模式，min模式为所监控的指标如果不下降就调整，min通常观察loss；max为指标不上升就调整，max通常观察准确率
factor：调整系数
patience：接受几次不发生变化
cooldown：停止监控一段时间
verbose：是否打印日志
min_lr：学习率下限
eps：学习率衰减最小值