pytorch训练神经网络爆内存解决办法

最新推荐文章于 2024-02-02 10:26:57 发布

lyf_666

最新推荐文章于 2024-02-02 10:26:57 发布

阅读量4.4k

点赞数 3

分类专栏： pytorch

本文链接：https://blog.csdn.net/lyf6_9123/article/details/115112729

版权

pytorch 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

pytorch训练神经网络爆内存解决办法

训练的时候内存一直在增加，最后内存爆满，被迫中断。
!](https://img-blog.csdnimg.cn/20210323110010729.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2x5ZjZfOTEyMw==,size_16,color_FFFFFF,t_70)
后来换了一个电脑发现还是这样，考虑是代码的问题。
检查才发现我的代码两次存了loss，只有一个地方写的是loss.item（）。问题就在loss，因为loss是variable类型。
要写成loss_train = loss_train + loss.item()，不能直接写loss_train = loss_train + loss。否则就会发现随着epoch的增加，占的内存也在一点一点增加。
算是一个小坑吧，希望大家还是要仔细。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lyf_666

关注关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
pytorch训练神经网络爆内存解决办法

pytorch训练神经网络爆内存解决办法训练的时候内存一直在增加，最后内存爆满，被迫中断。后来换了一个电脑发现还是这样，考虑是代码的问题。检查才发现我的代码两次存了loss，只有一个地方写的是loss.item（）。问题就在loss，因为loss是variable类型。要写成loss_train = loss_train + loss.item()，不能直接写loss_train = loss_train + loss。否则就会发现随着epoch的增加，占的内存也在一点一点增加。算是一个小坑吧，
复制链接

扫一扫