最近在学习mmdetection框架,在加载预训练模型时偶尔会遇到如下问题:
The model and loaded state dict do not match exactly
正常情况下只是把预训练模型最后一部分去掉,但是有时会出现一大串模块都没有匹配,比如在调用faster_rcnn_r50_caffe_c4_1x_coco.py的时候就会出现:
![5c99c78fc490f7620670f21e8a81e874.png](https://img-blog.csdnimg.cn/img_convert/5c99c78fc490f7620670f21e8a81e874.png)
而且还是两个错误,让人不得不怀疑是不是官方代码写错了。。。但其实如果我们仔细看这里的报错,容易发现,第一部分中,resnet的layer1到layer3都被load了,只有layer4没有被load,而在第二部分中,只有layer4被load了,两者似乎是互补的,再看到faster_rcnn_r50_caffe_c4.py:
![65955dfd5bc78e354736e67d3a1ad72c.png](https://img-blog.csdnimg.cn/img_convert/65955dfd5bc78e354736e67d3a1ad72c.png)
可以看到backbone只用到了3个stage,也就是resnet的c2~c4,所以layer4没有load是没问题的。同时,在shared head这一部分,stage=3,也就是把resnet的layer4作为shared_head,所以这一部分只需要导入layer4即可。如果mmdetection是先加载backbone的预训练模型,然后再加载shared head的预训练模型,那么一切也就说的通了,而事实上也是这样的:
![64b83ffdc72ed9f03803c6aadff3297b.png](https://img-blog.csdnimg.cn/img_convert/64b83ffdc72ed9f03803c6aadff3297b.png)
![c881bc2fe391b23e10c650f6d4ded874.png](https://img-blog.csdnimg.cn/img_convert/c881bc2fe391b23e10c650f6d4ded874.png)
综上,mmdetection在加载预训练模型时,如果警告“The model and loaded state dict do not match exactly”,不一定是预训练模型没有加载成功,也可能是mmdetection框架的特性导致的结果。