学习率迭代策略

最新推荐文章于 2024-06-08 15:07:29 发布

npupengsir

最新推荐文章于 2024-06-08 15:07:29 发布

阅读量1.4k

点赞数 2

分类专栏：深度学习算法

本文链接：https://blog.csdn.net/u012897374/article/details/112847980

版权

深度学习算法专栏收录该内容

18 篇文章 1 订阅

订阅专栏

1. 固定不变

base_lr = 0.01
lr_policy = "fixed"

2. step方法

每迭代step_size次后减少gamma倍。 $l r = l r \times g a m m a$

base_lr = 0.01
lr_policy = "step"
gamma = 0.1
stepsize= 10000

3. 多项式曲线下降式

$LR(t)=base\_lr\times(\frac{t}{T})^{power}$

base_lr = 0.01
lr_policy = "step"
gamma = 0.1
stepsize= 10000

4. Inv

learning rate随迭代次数增加而下降。 $LR(t)=base\_lr\times(1+gamma\times iter)^{power}$

5. pytorch自定义学习率调整策略

5.1. 使用lambda函数实现

nit_lr = 5e-4
max_iter = 15000
optimizer = SGD(params=net.parameters(), lr=init_lr, momentum=0.9, weight_decay=0.0005)
lambda_func = lambda step: (1-step/max_iter)**0.9
scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda_func)

for epoch in range(50):
	for i in range(1000):
    	...
        optimizer.step()
        scheduler.step()

注意这里使用lambda函数时只返回init_lr需要乘的系数即可。

5.2. 使用自定义类实现

需要继承torch.optim.lr_scheduler._LRScheduler类:

from torch.optim.lr_scheduler import _LRScheduler

class PolyLRDecay(_LRScheduler):
	def __init__(self, optimizer, max_decay_steps, end_learning_rate=0.0001, power=1)

需要实现两个方法:

def get_lr(self):

def step(self, step=None):

get_lr: 获得新的learning_rate数值
step: 执行一次更新

例子见: poly_lr_decay

5.3. 实现poly_lr_decay

$lr=lr\times (1-\frac{iter}{max\_iter})^{power}$

init_lr = 5e-4
max_iter = 15000
optimizer = SGD(params=net.parameters(), lr=init_lr, momentum=0.9, weight_decay=0.0005)
lambda_func = lambda step: (1-step/max_iter)**0.9
scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=lambda_func)
lrs = []

for epoch in range(15):
	for i in range(1000):
    	...
        optimizer.step()
        lrs.append(optimizer.param_groups[0]["lr"])
        scheduler.step()

plt.plot(range(15000), lrs)
plt.show()

5.4. 其他常见的learn_rate scheduler

在torch.optim.lr_scheduler模块中都有相关定义。常见的学习率变化函数及其曲线见: kaggle_pytorch_lr_scheduler

npupengsir

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
学习率迭代策略

1. 固定不变base_lr = 0.01lr_policy = "fixed"2. step方法每迭代step_size次后减少gamma倍。lr=lr×gammalr=lr×gammalr=lr×gammabase_lr = 0.01lr_policy = "step"gamma = 0.1stepsize= 100003. 多项式曲线下降式LR(t)=base_lr×(tT)powerLR(t)=base\_lr\times(\frac{t}{T})^{power}LR(t)=
复制链接

扫一扫

专栏目录