RuntimeError: Error(s) in loading state_dict for DataParallel:

最新推荐文章于 2024-05-05 11:30:08 发布

cv一段代码交差

最新推荐文章于 2024-05-05 11:30:08 发布

阅读量454

点赞数

分类专栏：报错文章标签：深度学习机器学习 python pytorch

本文链接：https://blog.csdn.net/qq_41856194/article/details/131075125

版权

报错专栏收录该内容

2 篇文章 0 订阅

订阅专栏

参考博主：http://t.csdn.cn/Kk6eX

http://t.csdn.cn/AZZcT

报错信息：

RuntimeError: Error(s) in loading state_dict for DataParallel:
    Missing key(s) in state_dict: "module.gcn.gc1.weight",
    Unexpected key(s) in state_dict: "gcn.gc1.weight",

模型训练时在单GPU上训练，测试时在多GPU上时，就会报这个错。

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model = Model()
if torch.cuda.device_count()>1:
    print(f"use {torch.cuda.device_count()} GPUs")
    model = nn.DataParallel(model,device_ids=device_ids)
model.to(device)

model = nn.DataParallel(model,device_ids=device_ids)；这句话表示使用多GPU并行。

虽然在训练和测试的时候我的device_ids里都只有1个GPU号，但是测试时还是会报这个错误，估计底层测试的时候还是按多GPU运算的吧，之后了解了再更新，求大神解答！

所以把在测试集中把代码改为：

model = Model()
if torch.cuda.is_available():
    model.cuda()
model.load_state_dict(torch.load(Model_Path + model_name, map_location='cuda:0'))

这样报错就解决了~~~

第二篇博文讲的是主动在参数前面添加module. 可以尝试一下。报错信息里面也写了，我们想要的key是module.xxx，而训练好的模型里是xxx。所以我们可以在代码里直接给key加上module.

ckpt = checkpoint['net']
    new_ckpt = {}
    for k, v in ckpt.items():
        k = 'module.' + k
        new_ckpt[k]=v
    model.load_state_dict(new_ckpt)