torch.optim.lr_scheduler.OneCycleLR

Lntano__y

于 2024-07-17 15:19:09 发布

阅读量709

点赞数 4

文章标签： pytorch 人工智能 python 深度学习

本文链接：https://blog.csdn.net/m0_49133355/article/details/140496224

版权

torch.optim.lr_scheduler.OneCycleLR 是 PyTorch 中的一个学习率调度器，它根据 “1cycle” 策略在训练期间调整学习率，可以提高训练性能和收敛性。

下面是给定参数的详细解释：

参数
optimizer:

要应用此调度器的优化器实例（例如，torch.optim.SGD、torch.optim.Adam）。
例子：optimizer = torch.optim.SGD(model.parameters(), lr=init_lr)
max_lr:

学习率的峰值。在这种情况下，它设置为 init_lr*10，其中 init_lr 是提供给优化器的初始学习率。
例子：如果 init_lr = 0.01，那么 max_lr = 0.1。
total_steps:

学习率调度将应用的总训练迭代次数（批次数）。
例子：如果 max_iters = 1000，则调度器将运行 1000 次迭代。
pct_start:

学习率增加到峰值的百分比，剩余的百分比用于学习率下降。在这里，它设置为 0.4，表示学习率将在前 40% 的训练步骤中增加，后 60% 的训练步骤中减少。
anneal_strategy:

学习率下降的策略。在这里，它设置为 ‘cos’，表示使用余弦退火策略。
其他可选值包括 ‘linear’。
cycle_momentum:

是否在周期内调整动量。如果为 True，则动量将在周期内变化。这里设置为 True。
base_momentum:

动量的最低值。在这里，它设置为 0.95 * 0.895。
max_momentum:

动量的最大值。在这里，它设置为 0.95。
div_factor:

用于计算初始学习率的除数，初始学习率为 max_lr / div_factor。在这里，它设置为 10。
例子：如果 max_lr = 0.1，那么初始学习率 init_lr = 0.1 / 10 = 0.01。
完整代码示例

import torch
import torch.optim as optim
import torch.nn as nn

# 定义模型
model = nn.Linear(10, 2)

# 初始学习率
init_lr = 0.01

# 优化器
optimizer = optim.SGD(model.parameters(), lr=init_lr)

# 最大迭代次数
max_iters = 1000

# 学习率调度器
scheduler = torch.optim.lr_scheduler.OneCycleLR(
    optimizer,
    max_lr=init_lr*10, 
    total_steps=max_iters, 
    pct_start=0.4, 
    anneal_strategy='cos',
    cycle_momentum=True, 
    base_momentum=0.95*0.895, 
    max_momentum=0.95,
    div_factor=10
)