Pytorch获取中间变量的梯度

清纯世纪

已于 2022-06-30 22:05:39 修改

阅读量1.3k

点赞数

分类专栏：记录本文章标签：大数据

于 2022-06-30 19:51:22 首次发布

本文链接：https://blog.csdn.net/qq_45100200/article/details/125547160

版权

本文介绍了在Pytorch中如何获取中间变量的梯度，包括使用torch.autograd.grad(outputs, inputs)和torch.Tensor.register_hook()两种方法。由于Pytorch默认只保留叶子结点的梯度，因此在反向传播后需要特殊方式来获取中间变量的梯度信息。" 126032482,13170895,SpringBoot整合MyBatisPlus实战教程,"['Java', 'MyBatisPlus', 'SpringBoot', '数据库开发', '快速开发']

摘要由CSDN通过智能技术生成

为了节省显存，pytorch在反向传播的过程中只保留了计算图中的叶子结点的梯度值，而未保留中间节点的梯度，如下例所示：

import torch
 
x = torch.tensor(3., requires_grad=True)
y = x ** 2
z = 4 * y
 
z.backward()
print(x.grad)   # tensor(24.)
print(y.grad)   # None

可以看到当进行反向传播后，只保留了x的梯度tensor(24.)，而y的梯度没有保留所以为None。

但有时我们需要得到模型中间变量的梯度（如绘制Grad-CAM图时），接下来介绍两种获取中间变量梯度的方法：

方法一：torch.autograd.grad(outputs, inputs)

可以看到此时x和y的梯度都可以获得，使用此方法时不用执行.backward()。

最低0.47元/天解锁文章

清纯世纪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录