python torch节约内存开销的运算方法

zeeq_

已于 2022-01-23 13:50:46 修改

阅读量1.1k

点赞数 1

于 2022-01-23 12:26:14 首次发布

本文链接：https://blog.csdn.net/weixin_44120025/article/details/122649639

版权

python 同时被 2 个专栏收录

28 篇文章 5 订阅

订阅专栏

pytorch

10 篇文章 2 订阅

订阅专栏

先是几个小示例，然后结合示例一起进行分析总结。示例如下，首先创建两个两行一列，值全为1的张量a和b，然后将b加到a上，使用python自带的id函数来获取a和b的内存地址。下面依次演示不同方法获得结果的差异：

1. `+`运算

a = torch.ones(2,1)
b = torch.ones(2,1)
before_id = id(a)
a = a + b
after_id = id(a)
before_id == after_id

输出为：

False

2. `+=`运算

a = torch.ones(2,1)
b = torch.ones(2,1)
before_id = id(a)
a += b
after_id = id(a)
before_id == after_id

输出为：

True

3. `[:]`运算

a = torch.ones(2,1)
b = torch.ones(2,1)
before_id = id(a)
a[:] = a + b
after_id = id(a)
before_id == after_id

输出为：

True

4 总结

从上面三个示例可以看出，+运算不是原地操作，我们将取消引用a指向的张量，转而指向新分配的内存处的张量。这可能是不可取的，原因有两个：首先，我们不想总是不必要地分配内存。在机器学习中，我们可能有数百兆的参数，并且在一秒内多次更新所有参数。通常情况下，我们希望原地执行这些更新。其次，如果我们不原地更新，其他引用仍然会指向旧的内存位置，这样我们的某些代码可能会无意中引用旧的参数。
幸运的是，执行原地操作非常简单。我们可以使用+=的方式进行，也可以使用切片表示法[:]将操作的结果分配给先前分配的数组，这样可以减少操作的内存开销。

zeeq_

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
python torch节约内存开销的运算方法

示例如下，首先创建两个两行一列，值全为1的张量a和b，然后将b加到a上，使用python自带的id函数来获取a和b的内存地址。下面依次演示不同方法获得结果的差异： 1. +运算a = torch.ones(2,1)b = torch.ones(2,1)before_id = id(a)a = a + bafter_id = id(a)before_id == after_id 输出为：False 2. +=运算a = torch.ones(2,1)b = torch
复制链接

扫一扫