RuntimeError: CUDA out of memory

最新推荐文章于 2024-08-08 03:12:58 发布

Star__dust

最新推荐文章于 2024-08-08 03:12:58 发布

阅读量1.8k

点赞数 1

分类专栏： bug解决

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Star__dust/article/details/103918970

版权

在运行深度学习代码时遇到CUDA out of memory错误。经过排查，不是tensorflow和pytorch冲突，也不是设备号问题，而是batchSize过大。通过减小batchSize到50，成功解决了GPU显存不足的问题。分析原因可能是程序一次性加载数据过多，导致显存溢出。

摘要由CSDN通过智能技术生成

问题描述

运行开源代码，使用CUDA在GPU运行，报错RuntimeError: CUDA out of memory. Tried to allocate 800.00 MiB (GPU 0; 6.00 GiB total capacity; 3.78 GiB already allocated; 155.14 MiB free; 679.80 MiB cached)

可以发现有6g用了3.78g，但是为什么说剩下只有155M，还有一个679Mcache是什么？现在我也不是很清楚，只是解决了问题

解决方法

搜罗网上方法

tensorflow和pytorch冲突
我用anaconda创建了新的虚拟环境，还是不行，顺便一提实际上不会冲突至少我最后解决时环境两个都装了，没有发生冲突现象两个都能用。
使用gpu进程过多导致gpu显存不足，关闭杀死一些进程
我用命令 nvidia-smi和任务管理器查看了6g显存几乎没用，显然不是
设备号问题默认使用0号显卡，该显卡被用或者其他原因不能使用，应该设置使用其他如1,2号显卡。也有说要显示设置使用0号显卡
具体参考：这里和这里和这里(皮一下)
结论是不行，设备号问题应该是多显卡才会可能发生，我的电脑就一个GTX1060的独显，默认设备号0&

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。