搞深度学习,跑程序遇到 out of memory的问题

我的系统是Ubuntu16.04,显卡是rtx 2080ti,跑ssd程序,结果报错 out of memory,像网上说的更改了batch_size ,改的很小也没有解决,还是会超出,考虑是不是够被占用了太多,都没有有效的释放才这样的,然后按下面办法进行了解决。
解决办法是:1.输入命令查看自己gpu的使用情况:watch -n 10 nvidia-smi
该命令可以监视gpu的动态,其中的数字代表10秒更新一次,你也可以设成别的数。
在这里插入图片描述
会看到上面这样的一个图。
2.发现gpu被占用了太多,所以现在跑的没有足够的显存可以用了,可以查看都是什么占用了显存,然后可以手动释放掉。
查看:sudo fuser /dev/nvidia*
该命令会显示所有占用nvidia设备的进程pid,将这些pid逐个kill掉:
释放:kill -9 pid
pid 为显示出来的那些个占用显存的号,如下图
在这里插入图片描述
这样完成后就可以重新跑了,没有错误出现。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值