脚本里将GPU设置为os.environ[‘CUDA_VISIBLE_DEVICES‘]后为何不起作用？

五点钟科技

已于 2023-04-04 18:53:36 修改

阅读量1.4k

点赞数 3

分类专栏：学习经验分享技术实战文章标签： python GPU pytorch 人工智能

于 2023-04-04 16:57:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36583400/article/details/129956883

版权

学习经验分享同时被 2 个专栏收录

9 篇文章 7 订阅

订阅专栏

8 篇文章 2 订阅

订阅专栏

很多时候我们明明在脚本里设置了

os.environ['CUDA_VISIBLE_DEVICES']='x, x, x'

可实际运行脚本的时候，发现torch调用的仍然是gpu0：

print(torch.cuda.current_device())

# 0

而且你本来就是因为显卡0已经占用着了，所以想用其它显卡启动训练，可偏偏还总是报GPU0显存不够的错误。

原因基本上有两个：

os.environ['CUDA_VISIBLE_DEVICES']='x, x, x'

这行代码必须在所有调用gpu的代码之前进行设置，特别是import torch必须要在指定gpu之后；最好的方法就是在你的脚本文件开头就写上调用代码。

第二个原因很可能就是你的batch size设置过大，这是很纯粹的原因，改一下batch size值就行了。这里推荐一篇博客，关于GPU的设置问题，我觉得写的很详细：

pytorch之多GPU使用——#CUDA_VISIBLE_DEVICES使用 #torch.nn.DataParallel() #报错解决 | 码农家园

五点钟科技

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
脚本里将GPU设置为os.environ[‘CUDA_VISIBLE_DEVICES‘]后为何不起作用？

第二个原因很可能就是你的batch size设置过大，这是很纯粹的原因，改一下batch size值就行了。这行代码必须在所有调用gpu的代码之前进行设置，特别是import torch必须要在指定gpu之后；最好的方法就是在你的脚本文件开头就写上调用代码。而且你本来就是因为显卡0已经占用着了，所以想用其它显卡启动训练，可偏偏还总是报GPU0显存不够的错误。很多时候我们明明在脚本里设置了。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

五点钟科技 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。