报错信息:
RuntimeError: Error(s) in loading state_dict for DataParallel:
Missing key(s) in state_dict: "module.gcn.gc1.weight",
Unexpected key(s) in state_dict: "gcn.gc1.weight",
模型训练时在单GPU上训练,测试时在多GPU上时,就会报这个错。
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model = Model()
if torch.cuda.device_count()>1:
print(f"use {torch.cuda.device_count()} GPUs")
model = nn.DataParallel(model,device_ids=device_ids)
model.to(device)
model = nn.DataParallel(model,device_ids=device_ids);这句话表示使用多GPU并行。
虽然在训练和测试的时候我的device_ids里都只有1个GPU号,但是测试时还是会报这个错误,估计底层测试的时候还是按多GPU运算的吧,之后了解了再更新,求大神解答!
所以把在测试集中把代码改为:
model = Model()
if torch.cuda.is_available():
model.cuda()
model.load_state_dict(torch.load(Model_Path + model_name, map_location='cuda:0'))
这样报错就解决了~~~
第二篇博文讲的是主动在参数前面添加module. 可以尝试一下。报错信息里面也写了,我们想要的key是module.xxx,而训练好的模型里是xxx。所以我们可以在代码里直接给key加上module.
ckpt = checkpoint['net']
new_ckpt = {}
for k, v in ckpt.items():
k = 'module.' + k
new_ckpt[k]=v
model.load_state_dict(new_ckpt)