Pytorch optimizer.step() 和loss.backward()和scheduler.step()的关系与区别

Wanderer001

已于 2023-11-02 20:11:00 修改

阅读量2.3k

点赞数 5

分类专栏： Pytorch 文章标签：计算机视觉深度学习机器学习

于 2022-04-29 07:51:13 首次发布

本文链接：https://blog.csdn.net/weixin_36670529/article/details/107048697

版权

首先需要明确optimzier优化器的作用, 形象地来说，优化器就是需要根据网络反向传播的梯度信息来更新网络的参数，以起到降低loss函数计算值的作用，这也是机器学习里面最一般的方法论。从优化器的作用出发，要使得优化器能够起作用，需要主要两个东西：1. 优化器需要知道当前的网络或者别的什么模型的参数空间，这也就是为什么在训练文件中，正式开始训练之前需要将网络的参数放到优化器里面，比如使用pytorch的话总会出现类似如下的代码：optimizer_G = Adam(model_G.parame

摘要由CSDN通过智能技术生成

参考 Pytorch optimizer.step() 和loss.backward()和scheduler.step()的关系与区别 - 云+社区 - 腾讯云

首先需要明确optimzier优化器的作用, 形象地来说，优化器就是需要根据网络反向传播的梯度信息来更新网络的参数，以起到降低loss函数计算值的作用，这也是机器学习里面最一般的方法论。

从优化器的作用出发，要使得优化器能够起作用，需要主要两个东西：

1. 优化器需要知道当前的网络或者别的什么模型的参数空间，这也就是为什么在训练文件中，正式开始训练之前需要将网络的参数放到优化器里面，比如使用pytorch的话总会出现类似如下的代码：

optimizer_G = Adam(model_G.parameters(), lr=train_c.lr_G)   # lr 使用的是初始lr
optimizer_D = Adam(model_D.parameters(), lr=train_c.lr_D)

2. 需要知道反向传播的梯度信息，我们还是从代码入手，如下所示是Pytorch 中SGD优化算法的step()函数具体写法，具体SGD的写法放在参考部分。

    def step(self, clos

最低0.47元/天解锁文章

Wanderer001

关注

5
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
1
评论
Pytorch optimizer.step() 和loss.backward()和scheduler.step()的关系与区别

首先需要明确optimzier优化器的作用, 形象地来说，优化器就是需要根据网络反向传播的梯度信息来更新网络的参数，以起到降低loss函数计算值的作用，这也是机器学习里面最一般的方法论。从优化器的作用出发，要使得优化器能够起作用，需要主要两个东西：1. 优化器需要知道当前的网络或者别的什么模型的参数空间，这也就是为什么在训练文件中，正式开始训练之前需要将网络的参数放到优化器里面，比如使用pytorch的话总会出现类似如下的代码：optimizer_G = Adam(model_G.parame
复制链接

扫一扫