RuntimeError: module must have its parameters and buffers on device cuda:2

最新推荐文章于 2024-04-24 23:47:47 发布

hyliuisme

最新推荐文章于 2024-04-24 23:47:47 发布

阅读量3k

点赞数 3

分类专栏：深度学习笔记

深度学习笔记专栏收录该内容

15 篇文章 1 订阅

订阅专栏

参考：https://blog.csdn.net/qq_30680871/article/details/90761272

报错RuntimeError: module must have its parameters and buffers on device cuda:2时主要是指定的GPU没有包含主卡的ID，如：

device = torch.device("cuda" if use_cuda else "cpu")

model = nn.DataParallel(model, device_ids=[1,2])

在定义device时“cuda”’要指定主卡，如果不指定默认主卡ID是0，然后指定运行的GPU ID是1，2然后就会报错，修改如下：

device = torch.device("cuda:1" if use_cuda else "cpu") # cuda和:1之间不能有空格

model = nn.DataParallel(model, device_ids=[1,2])

一下是pytorch一机多卡和多机多卡的API使用方法：

model = torch.nn.DataParallel(model, device_ids = [0,1,2,3])
该方法主要用于一机多卡。
model = torch.nn.parallel.DistributedDataParallel(model,device_ids=[arg.local_rank],output_device=arg.local_rank)
该方法主要用于分布式计算，多机多卡。

上边定义好GPU ID之后在训练的时候要用to(device)把数据转移到GPU上运行。

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。