关于错误:OOM ResourceExhaustedError 的完美解决方法

遇到的问题:
我使用MobileNet训练图片分类器,参数大概有几百万个并不是很多,然而报错OOM ResourceExhaustedError

分析:
这样的话可能有两个原因:

(1)batchsize太大,这种只需要将batchsize减小就行了

(2)GPU的显存太小,或者剩余的显存太少了

解决:
因为我将batchsize减少到1还是会出现这种错误,所以肯定不是batchsize太大的问题。

于是我用命令nvidia-smi查看了我的GPU使用情况,如下:

有个很奇怪的问题,没有进程在跑,但是显存占用Memory-Usage几乎被用完了。想通过kill掉进程也没进程可以kill.用命令fuser -v /dev/nvidia*找运行的进程,也没找到任何进程。

后来进过别人提醒才发现,是jupyter上许多之前的程序没有shutdown掉,一直在占用内存,打开jupyter,如下:

这是我已经shutdown之后的情况,但位置是一样的,将不用的程序shutdown就好了。

至此,问题完美解决。
 

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI周红伟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值