PyTorch: In-place Operation

最新推荐文章于 2022-12-06 03:45:00 发布

harry_tea

最新推荐文章于 2022-12-06 03:45:00 发布

阅读量672

点赞数

分类专栏： PyTorch 文章标签： pytorch 深度学习 python

本文链接：https://blog.csdn.net/weixin_41978699/article/details/122914151

版权

PyTorch 专栏收录该内容

50 篇文章 15 订阅

订阅专栏

本文目录

In-place Operation
- 常见的In-place操作
- 常见的Out-of-place操作

In-place Operation

In-place operation在pytorch中指的是支持原位修改tensor，这样就可以避免新的内存开销，主要是为了降低显存的消耗

但是在pytorch反向传播得到计算图的时候需要获取中间变量的值，如果使用in-place操作以后中间值就失去了，无法获得计算图，但是为什么有的激活函数写的in-place操作呢？

以ReLU函数为例，当输入值为正值时不变in-place与否不影响结果；当输入为负值时为0不进行反向传播了所以不影响

常见的In-place操作

1. 符号计算

*= +=等操作

在pytorch中尽量避免

tensor = torch.tensor([[1,2,3], [4,5,6]])
print(tensor.data_ptr())
tensor += 2
print(tensor.data_ptr())
tensor = tensor+2
print(tensor.data_ptr())
'''
140430616339712
140430616339712	# in-place
140430616321664 # out-of-place
'''

（继续补充）

常见的Out-of-place操作

1. 符号计算

a=a+b等，参考In-place操作

harry_tea

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PyTorch: In-place Operation

本文目录In-place Operation常见的In-place操作常见的Out-of-place操作In-place OperationIn-place operation在pytorch中指的是支持原位修改tensor，这样就可以避免新的内存开销，主要是为了降低显存的消耗但是在pytorch反向传播得到计算图的时候需要获取中间变量的值，如果使用in-place操作以后中间值就失去了，无法获得计算图，但是为什么有的激活函数写的in-place操作呢？以ReLU函数为例，当输入值为正值时不变in-
复制链接

扫一扫

专栏目录