最近在windows系统下使用pytorch1.5.0和torchvision0.6.1做一个小项目(使用torchvision内置的fasterrcnn模型进行目标检测)的时候发现一个小问题,即torchversion会自动下载一个resnet50的模型到一个系统路径:C:\Users\**你的windows用户名**\.cache\torch\checkpoints下,这种内置方法既不方便(模型的下载源在国外,下载比较慢),也不好部署,网上也查到一些方法,包括:pytorch预训练模型的下载地址以及解决下载速度慢的方法;【Pytorch】加载torchvision中预训练好的模型并修改默认下载路径(使用models.__dict__[model_name]()读取)等等一些大佬的博客,但是并不适用于fasterrcnn这个模型,因为这个模型中的resnet50是作为一个backbone来使用的,且无法指定加载路径,会自动进行下载。通过查看源码,我找到了一个方法来解决这个问题,供大家参考,也希望与大家进行交流。话不多说,先上代码:
def resnet_fpn_backbone(backbone_model):
'''
改写pytorch内置方法,
功能:将预加载的resnet模型设置为为backbone,可用于构建fasterrcnn
'''
# freeze layers
for name, parameter in backbone_model.named_parameters():
if 'layer2' not in name and 'layer3' not in name and 'layer4' not in name:
parameter.requires_grad_(False)
return_layers = {'layer1': '0', 'layer2': '1', 'layer3': '2', 'layer4': '3'}
in_channels_stage2 = backbone_model.inplanes // 8
in_channels_list = [
in_channels_stage2,
in_channels_stage2 * 2,
in_channels_stage2 * 4,
in_channels_stage2 * 8,
]
out_channels = 256
return BackboneWithFPN(backbone_model, return_layers, in_channels_list, out_channels)
def main():
all_tensor = [] #用于保存带预测的所有图片tensor
num_classes = 91 #预测结果中包含的目标类别数目
fasterrcnn_path = './fasterrcnn.pth' #fasterrcnn模型文件的保存路径
resnet50_path = './resnet50.pth' #restnet50模型文件的保存路径
image_path = './1.jpg' #待预测图片的保存路径
score_threshold = 0.8 #预测结果阈值
# 模型创建
resnet50_pre = torch.load(resnet50_path, map_location=torch.device('cpu'))
resnet_model = torchvision.models.resnet.resnet50()
resnet_model.load_state_dict(resnet50_pre)
fasterrcnn_pre = torch.load(fasterrcnn_path, map_location=torch.device('cpu'))
model = torchvision.models.detection.FasterRCNN(resnet_fpn_backbone(resnet_model), num_classes)
model.load_state_dict(fasterrcnn_pre['model'])
model.eval() #设置模型为评估模式,不进行参数优化
几点说明:
1.首先要下载好torchvision官方的的resnet50和预训练好的fasterrcnn模型copy到当前路径下;
2.先使用torchvision内置的方法创建resnet50的模型,并使用load_state_dict方法加载模型;
3.接下来是比较重要的一步,就是改写torchvision模块backbone_utils.py文件中的resnet_fpn_backbone方法,因为torch模块就是通过这个方法来下载并加载resnet50模型的。初始的代码如下所示:
def resnet_fpn_backbone(backbone_name, pretrained):
backbone = resnet.__dict__[backbone_name](
pretrained=pretrained,
norm_layer=misc_nn_ops.FrozenBatchNorm2d)
# freeze layers
for name, parameter in backbone.named_parameters():
if 'layer2' not in name and 'layer3' not in name and 'layer4' not in name:
parameter.requires_grad_(False)
return_layers = {'layer1': '0', 'layer2': '1', 'layer3': '2', 'layer4': '3'}
in_channels_stage2 = backbone.inplanes // 8
in_channels_list = [
in_channels_stage2,
in_channels_stage2 * 2,
in_channels_stage2 * 4,
in_channels_stage2 * 8,
]
out_channels = 256
return BackboneWithFPN(backbone, return_layers, in_channels_list, out_channels)
将这一段代码内容修改为上面一段代码中的同名的方法;
4.接下来使用使用torchvision内置的方法来加载fasterrcnn,并将resnet_fpn_backbone方法转换后的resnet50作为参数传入(参考第一段代码最下面一部分的内容)即可。