pytorch多GPU训练单GPU测试出错,解决预训练模型se_resnext50_32x4d()问题

多卡训练后的保存模型开头为"module.XXX",参考两篇博客加载仍然报错,仔细研究发现,根据se_resnext50_32x4d()预训练模型改编的模型有些层名字中含有“XXXfc_module.layerXXX",多卡训练后变成”module.XXXfc_module.layerXXX"。此时根据python中字符串替换函数,string.replace('module.', '')把后面的"module."也给误伤删掉了导致错误,因此在函数中加一个1,即string.replace('module.', '', 1)最多只替换掉一个字符串。验证跑的通,问题解决。


model = se_resnext50_32x4d(num_classes=9, pretrained=None)  # 在源码基础上改变后
pretrained_dict = torch.load("0821_fine.pth")  # 加载多卡训练后模型的字典
net_dict = model.state_dict()  # 当前模型的字典(单卡)
# 剔除多卡中的module关键字
for k, v in pretrained_dict.items():
    # 只删除一个
    name = k.replace('module.', '', 1)
    net_dict[name] = v
# 根据预训练字典更新当前模型
model.load_state_dict(net_dict)
model.cuda()

参考:1.https://blog.csdn.net/qq_39638957/article/details/98349305

参考:2.https://blog.csdn.net/qidailiming1994/article/details/107285658/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在PyTorch中加载预训练模型时,如果不想使用多GPU,可以通过以下步骤进行操作。 首先,我们需要导入必要的库和模块: ```python import torch import torchvision.models as models ``` 接下来,我们可以选择要加载的预训练模型。这里以ResNet-50为例: ```python model = models.resnet50(pretrained=True) ``` 接下来,我们需要检查当前系统中的GPU数量。可以使用`torch.cuda.device_count()`来获取GPU的数量。 ```python gpu_count = torch.cuda.device_count() ``` 如果`gpu_count`的值大于1,表示有多个GPU可用。为了确保模型只在GPU上运行,我们需要使用`torch.nn.DataParallel`模块。但是,如果不想使用多GPU,则需要取消这个模块的使用。 如果只有一个GPU可用,我们可以简地将模型转移到该GPU上: ```python if gpu_count == 1: model = model.cuda() ``` 如果有多个GPU可用,我们可以使用`torch.nn.DataParallel`模块来加载预训练模型,并将模型转移到主GPU上: ```python if gpu_count > 1: model = torch.nn.DataParallel(model).cuda() ``` 最后,我们可以使用加载的预训练模型进行后续操作。 总之,为了不使用多GPU进行模型加载,我们需要通过检查GPU数量,并相应地转移到GPU或使用`torch.nn.DataParallel`模块转移到主GPU上。这样可以确保模型在GPU上运行而不会使用多GPU。 ### 回答2: 在PyTorch中,加载预训练模型时,如果不希望使用多个GPU上的module,可以通过以下步骤实现: 首先,使用torch.load()函数加载预训练模型的权重和参数,例如: ```python model_state_dict = torch.load('pretrained_model.pth') ``` 然后,在加载模型之前,可以通过修改model_state_dict来删除原模型中包含的多GPU相关的module前缀。默认情况下,PyTorch在保存模型时,会自动添加"module."前缀来标识使用多GPU。例如,如果模型原本的键名为"module.conv1.weight",则可以通过以下代码提取模型参数的键名: ```python new_model_state_dict = {} for k, v in model_state_dict.items(): name = k[7:] # 去掉"module."前缀 new_model_state_dict[name] = v ``` 接下来,创建新的模型实例,并将修改后的参数加载到该实例中: ```python model = YourModel() # 创建新的模型实例 model.load_state_dict(new_model_state_dict) # 加载修改后的模型参数 ``` 注意,这里的YourModel()应该是与预训练模型相同的模型类实例化得到的对象。 通过这样的处理,就可以将预训练模型加载到GPU上的模型中,而无需考虑多GPUmodule问题

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值