Pytorch的Tensor.to(device)函数不会保存张量的requires_grad信息？

最新推荐文章于 2024-06-02 15:51:08 发布

miguemath

最新推荐文章于 2024-06-02 15:51:08 发布

阅读量4.8k

点赞数 2

分类专栏： Pytorch 文章标签： python 深度学习 debug pytorch 神经网络

本文链接：https://blog.csdn.net/wangkaidehao/article/details/104263027

版权

在Pytorch中，使用Tensor.to(device)可能会导致中间节点的requires_grad=True但无法获取梯度的问题。通过分开设备迁移和张量赋值，或者在创建时指定设备与requires_grad，可以正确保存梯度。

摘要由CSDN通过智能技术生成

博主最近在写这篇文章的时候，发现即使我使用了backward()，也无法得到我想要的参数的梯度。
博主当然知道pytorch默认只保存叶结点的grad，对于那些中间结点的grad则是一律丢弃。博主当然也知道使用register_hook来获取中间结点的grad。然而这些都不能解决我的问题。我的问题代码如下：

import torch 
import numpy as np

device = torch.device('cuda')
x = torch.tensor(np.random.normal(0, 1, [2,3]), requires_grad = True).to(device)
print("grad1: ",x.requires_grad)
y = 2 * x + 3
z = y.sum()
z.backward()
print("grad2: ",x.requires_grad) 
print("grad3: ",x.</

最低0.47元/天解锁文章

miguemath

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
Pytorch的Tensor.to(device)函数不会保存张量的requires_grad信息？

博主最近在跑代码的时候，发现即使我使用了backward()，也无法得到我想要的参数的梯度。博主当然知道pytorch默认只保存叶结点的grad，对于那些中间结点的grad则是一律丢弃。博主当然也知道使用register_hook来获取中间结点的grad。然而这些都不能解决我的问题。我的问题代码如下：import torch import numpy as npdevice = torc...
复制链接

扫一扫

专栏目录