Pytorch CUDA out of memory显存爆炸

靳航ppp

已于 2024-02-28 11:06:01 修改

阅读量2.2k

点赞数

文章标签： pytorch 深度学习神经网络机器学习数据挖掘

于 2020-12-22 12:19:52 首次发布

本文链接：https://blog.csdn.net/haha456487/article/details/111526761

版权

我在跑pytorch的时候，显存的报错如下（真的是GPU显存全部占用完了）：

RuntimeError: CUDA out of memory. Tried to allocate 24.00 MiB (GPU 0; 11.92 GiB total capacity; 11.01 GiB already allocated; 7.63 MiB free; 11.22 GiB reserved in total by PyTorch)

可能的原因是：

① 在循环训练中累积历史记录

在这里插入图片描述
具体请点击这里查看（https://ptorch.com/news/160.html）

② 如果测试时爆显存，有可能是忘记设置no_grad了

即在测试代码前加一行with torch.no_grad():即可。
具体请点击这里查看（https://blog.csdn.net/xiaoxifei/article/details/84377204）

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

靳航ppp

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
Pytorch CUDA out of memory显存爆炸

我在跑pytorch的时候，显存的报错如下（真的是GPU显存全部占用完了）：RuntimeError: CUDA out of memory. Tried to allocate 24.00 MiB (GPU 0; 11.92 GiB total capacity; 11.01 GiB already allocated; 7.63 MiB free; 11.22 GiB reserved in total by PyTorch)可能的原因是：① 在循环训练中累积历史记录具体请点击这里查看（ht
复制链接

扫一扫

pytorch模型提示超出内存RuntimeError: CUDA out of memory.

01-20

跑模型时出现RuntimeError: CUDA out of memory.错误查阅了许多相关内容，原因是：GPU显存内存不够简单总结一下解决方法：将batch_size改小。取torch变量标量值时使用item()属性。可以在测试阶段添加如下代码：...

Pytorch释放显存占用方式

09-18

今天小编就为大家分享一篇Pytorch释放显存占用方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

1 条评论您还未登录，请先登录后发表或查看评论

Pytorch GPU显存充足却显示out of memory的解决方式

09-18

今天小编就为大家分享一篇Pytorch GPU显存充足却显示out of memory的解决方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

解决PyTorch中的`CUDA out of memory`错误

热门推荐

weixin_44935658的博客

10-09

4万+

可以看到这个机子有两张A5000，第一张卡显存是23953MiB / 24564MiB，快用完了，第二张是 18372MiB / 24564MiB，还有一点可以用。两个不同设备上的tensor运算，这个错误一般torch会报错的，但是也有非常隐晦的情况，比如不指明在哪个设备上的常量，需要手动发现。到了要检查代码这一步首先是看batch_size，但如果batch_size太大了应该是一个epoch都跑不了，在前向传播的时候甚至前向传播之前就会出问题了。，一般我会在命令行指定卡，而不是代码里。

pytorch训练过程显存爆炸，随着epoch增加不断增加

RAGERAGE_的博客

11-30

1058

原来我在反向传播完后会累加loss，以计算平均损失打印出来并写入tensorboard，而我在累加loss时用的是loss_epoch += loss ，此时loss会被放入计算图中一起保存，实际上除了反向传播以外，我的loss只是要那个数值而已。在训练时，明明前几个epoch都能正常跑，但是到了某一个epoch突然给我报显存不够了。我寻思你跑完epoch难道不释放显存的吗，为啥epoch和epoch之间的差距还这么大？经过多方查询，多种方法的尝试，最终定位到loss的计算上。

Pytorch使用过程中显存爆炸解决办法

cherreggy的博客

11-29

2005

方法放在GPU上，临时的一个batch数据也在训练时放在GPU上进行计算，随着时间推移，显存占用指数倍增长，如果可以的话，把训练过程中的pytorch变量对象转换成numpy变量会大大减少显存的占用。pytorch中的python对象占用空间很大，模型可以用。

【Pytorch】GPU内存爆炸的原因

iefenghao的博客

07-16

2125

GPU内存爆炸：RuntimeError: CUDA out of memory.

解决CUDA out of memory，**reserved in total by PyTorch

closejudge的博客

11-22

413

训练或者验证的时候batch都改小就行了，默认的batch数值可能比较大。

pytorch出现RuntimeError: CUDA out of memory.--------MDSR

qq_40759170的博客

08-08

1472

在运行MDSR程序时，分别两次出现CUDA out of memory. 第一次是在数据训练的过程中，由于Batch_size设置过大，导致内存不足，将其设置较小即可解决。第二次是在测试过程中，由于是直接导入训练好的模型，不需要再次进行反向传播。因此在进行前向传播之前加入 with torch.no_grad(): 即可解决。即 with torch.no_grad(): ...

测试时报错 RuntimeError: CUDA out of memory.

齐天大胜

12-19

3198

问题描述：训练神经网络模型，训练时正常，训练一个epoch后测试的时候，报错RuntimeError: CUDA out of memory. 然而我的模型并没有很大，GPU占用率也不高。解决方法： with torch.no_grad(): (your test code) ...

[pytorch]亲测解决RuntimeError: CUDA out of memory

万万VV

03-17

1万+

问题当我在测试训练好的基于Pytorch框架的半监督视频目标分割模型时，我已经加上了Model.eval( )，用于测试，但是运行过程中报错：RuntimeError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 3.95 GiB total capacity; 3.39 GiB already allocated; 9.88...

【Pytorch】记录Pytorch搭建的模型引发的CUDA out of memory错误

pangpd的博客

07-23

941

问题描述已经是第三次记录MemoryError的问题了！！！第一次：https://blog.csdn.net/weixin_43519707/article/details/106095449 第二次：https://blog.csdn.net/weixin_43519707/article/details/106376094 实验研究要用到三个数据集，再正常运行玩第一个数据集后，在进行第二和第三个数据集进行实验，但是遇到了： RuntimeError: CUDA out of memory. Tr

pytorch 如何解决RuntimeError: CUDA out of memory

weixin_39326879的博客

05-15

6071

出现的原因这个提醒的意思就是运行过程中所需的内存超过CUDA的内存解决办法 1.最直接的解决办法是减小batch_size(常用),或者减小模型参数和输入大小(一般很少这样做); 2.如果测试过程遇到这种情况,加上 with torch.no_grad(): 内存就不会分配参数梯度的空间 3.如果在训练过程遇到这种情况,可以尝试在训练前先释放CUDA内存 nvidia-smi查看GPU使用率,如果使用率不高,就使用torch.cuda.empty_cache()释放内存官网对于torch.cuda.e

模型预测过程中：cuda out of memory

weixin_45636772的博客

11-29

1134

yolov7预测过程中cuda out of memory，加了torch.cuda.empty_cache()依然无效

cuda out of memory pytorch

06-28

cuda out of memory pytorch 是指在使用 PyTorch 进行深度学习模型训练时，由于 GPU 显存不足而导致程序崩溃的错误。这通常是因为模型或数据集过大，或者 GPU 显存设置不当所致。解决方法包括减小模型规模、减小 ...