torch.optim.lr_scheduler.StepLR参数解析

jjw_zyfx

已于 2023-05-18 20:02:26 修改

阅读量1.3w

点赞数 13

分类专栏： pytorch 文章标签： pytorch 深度学习

于 2021-09-22 20:36:48 首次发布

本文链接：https://blog.csdn.net/jjw_zyfx/article/details/120422398

版权

pytorch 专栏收录该内容

69 篇文章 8 订阅

订阅专栏

trainer = torch.optim.SGD(net.parameters(), lr=lr, momentum=0.9,weight_decay=wd)
scheduler = torch.optim.lr_scheduler.StepLR(trainer, lr_period, lr_decay)

官网的参数结构：

在这里插入图片描述

第一个参数就是所使用的优化器对象

第二个参数就是每多少轮循环后更新一次学习率(lr)

第三个参数就是每次更新lr的gamma倍

为啥要调整学习率？

假设函数为 $f(x) = x^2$ 每次更新的x应为 x -= dx * lr 其中dx为对x的一阶求导，所以如果lr一直不变，x在绝大多数情况下不会取到最低点的 $x_0$ 的值，所以f(x)的值一直在最低点左右震荡，如下图的绿色箭头所示，但是如果不断调整学习率则可以使结果在离最优点 $x_0$ 的位置更近，则f(x)的值更优，这也就是我们更想要的结果。