data()和detach()的区别

最新推荐文章于 2024-02-13 00:33:55 发布

是依韵阿

最新推荐文章于 2024-02-13 00:33:55 发布

阅读量716

点赞数 2

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/qq_39377134/article/details/103206818

版权

python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

最近在控制台输出一下loss的时候用到了这俩函数，在这里记录一下。
总体上来说tensor.detach()是为了解决tensor.data()的安全性提出的。tensor.detach()相对较为安全。因为当通过.detach()得到的tensor间接修改原来的tensor后继续在计算图中使用时会报错，但是通过.data()得到的tensor间接修改原tensor后继续在计算图中使用就会被忽略被修改的过程，例如：

>>> a = torch.tensor([1,2,3.], requires_grad =True)
>>> out = a.sigmoid()		#原本是out这个tensor
>>> c = out.data				#这里是data()
>>> c.zero_()
tensor([ 0., 0., 0.])

>>> out                   #  在这里out的数值被c.zero_()修改也就是提到的原来的out这个tensor被间接修改了
tensor([ 0., 0., 0.])

>>> out.sum().backward()  #  修改后的out参与反向传播
>>> a.grad                #  这个结果很严重的错误，因为out已经改变了
tensor([ 0., 0., 0.])

但是如果换成.detach()

>>> a = torch.tensor([1,2,3.], requires_grad =True)
>>> out = a.sigmoid()			#原本是out这个tensor
>>> c = out.detach()			#这里是detach()
>>> c.zero_()
tensor([ 0., 0., 0.])

>>> out                   #  out的值被c.zero_()修改
tensor([ 0., 0., 0.])

>>> out.sum().backward()  # out参与反向传播，但是已经被c.zero_()了，结果报错
RuntimeError: one of the variables needed for gradient
computation has been modified by an

是依韵阿

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
data()和detach()的区别

最近在控制台输出一下loss的时候用到了这俩函数，在这里记录一下。总体上来说tensor.detach()是为了解决tensor.data()的安全性提出的。tensor.detach()相对较为安全。因为当通过.detach()得到的tensor间接修改原来的tensor后继续在计算图中使用时会报错，但是通过.data()得到的tensor间接修改原tensor后继续在计算图中使用就会被忽略被...
复制链接

扫一扫

专栏目录