pytorch学习率调整详解

最新推荐文章于 2024-08-12 07:57:32 发布

winycg

最新推荐文章于 2024-08-12 07:57:32 发布

阅读量6.3k

点赞数 3

分类专栏：深度学习与pytorch

本文链接：https://blog.csdn.net/winycg/article/details/87981725

版权

深度学习与pytorch 专栏收录该内容

49 篇文章 19 订阅

订阅专栏

pytorch中既自带了学习率函数，我们也可以自定义学习率调整函数。调整函数通常随epoch的变化而变化。首先实现自定义学习率调整：

自定义学习率调整

以SGDR余弦学习率调整为例：
论文地址：https://arxiv.org/abs/1608.03983
使用 $T_{0},T_{mult}$ 的策略，初始为 $T_{0}$ 个epoch为一个学习率调整周期，之后的周期是前一个周期epoch的 $T_{mult}$ 倍。对于一个学习率周期 $i$ ，假设有 $T_{i}$ 个epoch，当前所处的位置为第 $T_{cur}$ 个epoch，则当前epoch的学习率为：
$\eta_{t}=\eta_{min}+\frac{1}{2}(\eta_{max}-\eta_{min})(1+\cos(\frac{T_{cur}}{T_{i}}\pi))$
对于 $T_{0}=10,T_{mult=2}$ ，设训练100个epoch，则对应的学习率变化曲线为：
在这里插入图片描述
在pytorch中的训练代码：

# 第epoch值进行计算并更新学习率
def adjust_lr(optimizer, epoch, T_0=10, eta_max=0.1, eta_min=0.):
	if T_mul == 2:
	    i = np.log2(epoch / T_0 + 1).astype(np.int)
	    T_cur = epoch - T_0 * (T_mult ** (i) - 1)
	    T_i = (T_0 * T_mult ** i)
	elif T_mul == 1:
		T_cur = epoch % T_0
        T_i = T_0
	cur_lr = eta_min + 0.5 * (eta_max - eta_min) * (1 + np.cos(np.pi * T_cur / T_i))

    for param_group in optimizer.param_groups:
        param_group['lr'] = cur_lr


optimizer = optim.SGD(net.parameters(), lr=0.1, momentum=0.9, weight_decay=1e-4, nesterov=True)
for epoch in range(100):
	adjust_lr(optimizer, epoch)
	train()

Note: optimizer.param_groups保存为了优化器的参数信息，为一个列表，但是只有一个字典元素，字典里面具有参数信息。

pytorch自带的学习率函数

pytorch的torch.optim.lr_scheduler模块提供了许多基于epoch 的学习率函数。以SGDR中的 $T_{mult}=1$ 余弦学习率调整函数为例进行讲解使用如何调用pytorch中的学习率函数。Moreover，pytorch只提供了 $T_{mult}=1$ 情况下的SGDR的学习率调整，故在上文我们手工实现了更general的调整。
文档链接：https://pytorch.org/docs/stable/optim.html#torch.optim.lr_scheduler.CosineAnnealingLR

optimizer = optim.SGD(net.parameters(), lr=0.1, momentum=0.9, weight_decay=1e-4, nesterov=True)
lr_schduler = optim.lr_scheduler.CosineAnnealingLR(optimizer, T_max=300, eta_min=0)

for epoch in range(100):
	lr_schduler.step(epoch)
	train()