如何使用pytorch保存训练得到的特征数据而又不占用内存

最新推荐文章于 2023-03-22 11:00:28 发布

星空img

最新推荐文章于 2023-03-22 11:00:28 发布

阅读量1.1k

点赞数

分类专栏：技术交流

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36614831/article/details/104793954

版权

技术交流专栏收录该内容

6 篇文章 0 订阅

订阅专栏

clone()/copy()/detach()

clone()函数是新开辟一个内存给数据，但是仍然在计算图上；detach()是有一个不计算梯度的副本，不在计算图上，但是和原数据指向的是同一内存空间。因此，想要获取一个完全与原有数据独立的数据可以使用b=a.clone().detach()

a是GPU上的模型输出的tensor，用clone()将它拷贝到CPU上，然后再把拷贝的结果存储在一个OrderedDict()中，

原来的gpu上的tensor占用的显存并没有随着循环结束被释放，造成显存out of memory

原因是clone()的时候关联了求导关系，因此无法释放原来变量的内存

解决方法：

b=a.data 或者 b=a.detach()（推荐）

这两种赋值方式将a的tensor赋值给b，不会有链式求导联系。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何使用pytorch保存训练得到的特征数据而又不占用内存

clone()/copy()/detach()clone()函数是新开辟一个内存给数据，但是仍然在计算图上；detach()是有一个不计算梯度的副本，不在计算图上，但是和原数据指向的是同一内存空间。因此，想要获取一个完全与原有数据独立的数据可以使用b=a.clone().detach()a是GPU上的模型输出的tensor，用clone()将它拷贝到CPU上，然后再把拷贝的结果存储在...
复制链接

扫一扫

专栏目录

星空img CSDN认证博客专家 CSDN认证企业博客

码龄8年

21: 原创

73万+: 周排名

28万+: 总排名

2万+: 访问

: 等级

500: 积分

683: 粉丝

41: 获赞

22: 评论

207: 收藏

私信

关注

热门文章

分类专栏

最新评论

starGAN网络在跨域行人重识别上的应用
FVPHS: parser.add_argument('--image_size', '--array', default=[192, 64], help='image resolution')这一步楼主具体是怎样设置的啊，我在运行的时候一直报错，因为是矩阵形式导致卷积核大小无法计算，而int形式大小的格式训练出来的模型无用
starGAN网络在跨域行人重识别上的应用
FVPHS: 是不是博主做域转换是训练将market的图像转换成duke的8个摄像头风格，而如果我们仅仅只是想做market种的1个摄像头风格转换到其他5种摄像头风格是不是直接就c1和c2的数据一致即可
starGAN网络在跨域行人重识别上的应用
FVPHS: 我对此也是有疑问的，不知道xd你弄明白了吗，能否给我解答一下
starGAN网络在跨域行人重识别上的应用
FVPHS: 楼主你好，我想问一下您训练这个数据集模型的硬件配置以及花费的时间是怎样的，此外有没有直接保存的模型数据checkpoint以供使用呢
车辆计数系统 python实现
xrbaa: 太牛了，这么点儿代码就能实现，能在单片机上跑起来吗？期待博主的回复。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。