optimizer.zero_grad()和net.zero_grad()区别

开飞机的小毛驴儿

于 2020-02-27 00:17:03 发布

阅读量4.4k

点赞数 6

分类专栏：深度学习

本文链接：https://blog.csdn.net/jzwong/article/details/104528159

版权

深度学习专栏收录该内容

141 篇文章 18 订阅

订阅专栏

翻译自https://discuss.pytorch.org/t/zero-grad-optimizer-or-net/1887，本文只做个人记录学习使用，版权归原作者所有。

在基于pytorch的神经网络训练代码中，经常看到optimizer.zero_grad()和net.zero_grad()进行梯度清零操作，但是这两者有什么区别呢？PyTorch论坛上有人给出了解释，特此记录。

也就是说，如果

optimizer=optim.Optimizer(net.parameters())

optimizer.zero_grad()和net.zero_grad()是等价的，原因在于zero_grad()函数的定义：

def zero_grad(self):
    """Sets gradients of all model parameters to zero."""
    for p in self.parameters():
        if p.grad is not None:
            p.grad.data.zero_()

开飞机的小毛驴儿

关注

6
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录