linux单机多卡报错 CUDA device 1 but torch.cuda.device_count() is 1

夏日清风有你

已于 2022-04-17 22:47:09 修改

阅读量1.7k

点赞数 1

分类专栏： conda PyTorch 文章标签： pytorch

于 2022-04-13 21:16:06 首次发布

本文链接：https://blog.csdn.net/fanlily913/article/details/124158104

版权

50 篇文章 1 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

RuntimeError: Attempting to deserialize object on CUDA device 1 but torch.cuda.device_count() is 1.

出现这样的原因是因为我用了第二块GPU训练，在另一台机器上加载模型的时候，没有了第二块GPU，这时候就要指定用“cuda:0”

torch.load('./modelSubmit/encoder_48.pth.tar',map_location='cuda:0')

或者
模型原本是使用两个GPU进行训练的，但是我的电脑仅有一个GPU，所以会报错

model = torch.load(model_path) # 原来
model = torch.load(model_path, map_location='cuda:0') # 改为这样

linux单机多卡程序并行

多环境：
安装了多个conda 环境，env1，env2， env3，env4

单机多卡：
cuda 0, 1，2, 3

需求表：

1：尝试使用同一个conda 环境跑2个测试用例，失败了，报错CUDA 不可用

2：尝试2个环境，跑副本程序（copy一份）是可以的**

注意：
conda env list ( 查看环境）
进入conda 的环境再运行，即是使用了当前环境

关注

专栏目录