Pytorch_使torchvision只从本地加载代码，不再自动下载模型

最新推荐文章于 2024-03-07 10:17:57 发布

thiefun2020

最新推荐文章于 2024-03-07 10:17:57 发布

阅读量1k

点赞数

分类专栏：工程技巧及debug 文章标签： pytorch 深度学习神经网络

本文链接：https://blog.csdn.net/thiefun2020/article/details/108592916

版权

工程技巧及debug 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

最近在windows系统下使用pytorch1.5.0和torchvision0.6.1做一个小项目（使用torchvision内置的fasterrcnn模型进行目标检测）的时候发现一个小问题，即torchversion会自动下载一个resnet50的模型到一个系统路径：C:\Users\**你的windows用户名**\.cache\torch\checkpoints下，这种内置方法既不方便（模型的下载源在国外，下载比较慢），也不好部署，网上也查到一些方法，包括：pytorch预训练模型的下载地址以及解决下载速度慢的方法；【Pytorch】加载torchvision中预训练好的模型并修改默认下载路径（使用models.__dict__[model_name]()读取）等等一些大佬的博客，但是并不适用于fasterrcnn这个模型，因为这个模型中的resnet50是作为一个backbone来使用的，且无法指定加载路径，会自动进行下载。通过查看源码，我找到了一个方法来解决这个问题，供大家参考，也希望与大家进行交流。话不多说，先上代码：

def resnet_fpn_backbone(backbone_model):
    '''
    改写pytorch内置方法，
    功能：将预加载的resnet模型设置为为backbone，可用于构建fasterrcnn
    '''
    # freeze layers
    for name, parameter in backbone_model.named_parameters():
        if 'layer2' not in name and 'layer3' not in name and 'layer4' not in name:
            parameter.requires_grad_(False)

    return_layers = {'layer1': '0', 'layer2': '1', 'layer3': '2', 'layer4': '3'}

    in_channels_stage2 = backbone_model.inplanes // 8
    in_channels_list = [
        in_channels_stage2,
        in_channels_stage2 * 2,
        in_channels_stage2 * 4,
        in_channels_stage2 * 8,
    ]
    out_channels = 256
    return BackboneWithFPN(backbone_model, return_layers, in_channels_list, out_channels)

def main():
    
    all_tensor = [] #用于保存带预测的所有图片tensor
    num_classes = 91 #预测结果中包含的目标类别数目
    fasterrcnn_path = './fasterrcnn.pth' #fasterrcnn模型文件的保存路径
    resnet50_path = './resnet50.pth' #restnet50模型文件的保存路径
    image_path = './1.jpg' #待预测图片的保存路径
    score_threshold = 0.8 #预测结果阈值
        
    # 模型创建
    resnet50_pre = torch.load(resnet50_path, map_location=torch.device('cpu'))  
    resnet_model = torchvision.models.resnet.resnet50()
    resnet_model.load_state_dict(resnet50_pre)

    fasterrcnn_pre = torch.load(fasterrcnn_path, map_location=torch.device('cpu'))
    model = torchvision.models.detection.FasterRCNN(resnet_fpn_backbone(resnet_model), num_classes)  
    model.load_state_dict(fasterrcnn_pre['model'])
    model.eval() #设置模型为评估模式，不进行参数优化

几点说明：

1.首先要下载好torchvision官方的的resnet50和预训练好的fasterrcnn模型copy到当前路径下；

2.先使用torchvision内置的方法创建resnet50的模型，并使用load_state_dict方法加载模型；

3.接下来是比较重要的一步，就是改写torchvision模块backbone_utils.py文件中的resnet_fpn_backbone方法，因为torch模块就是通过这个方法来下载并加载resnet50模型的。初始的代码如下所示：

def resnet_fpn_backbone(backbone_name, pretrained):
    backbone = resnet.__dict__[backbone_name](
        pretrained=pretrained,
        norm_layer=misc_nn_ops.FrozenBatchNorm2d)
    # freeze layers
    for name, parameter in backbone.named_parameters():
        if 'layer2' not in name and 'layer3' not in name and 'layer4' not in name:
            parameter.requires_grad_(False)

    return_layers = {'layer1': '0', 'layer2': '1', 'layer3': '2', 'layer4': '3'}

    in_channels_stage2 = backbone.inplanes // 8
    in_channels_list = [
        in_channels_stage2,
        in_channels_stage2 * 2,
        in_channels_stage2 * 4,
        in_channels_stage2 * 8,
    ]
    out_channels = 256
    return BackboneWithFPN(backbone, return_layers, in_channels_list, out_channels)

将这一段代码内容修改为上面一段代码中的同名的方法；

4.接下来使用使用torchvision内置的方法来加载fasterrcnn，并将resnet_fpn_backbone方法转换后的resnet50作为参数传入（参考第一段代码最下面一部分的内容）即可。

thiefun2020

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Pytorch_使torchvision只从本地加载代码，不再自动下载模型

最近在windows系统下使用pytorch1.5.0和torchvision0.6.1做一个小项目（使用torchvision内置的fasterrcnn模型进行目标检测）的时候发现一个小问题，即torchversion会自动下载一个resnet50的模型到一个系统路径：C:\Users\**你的windows用户名**\.cache\torch\checkpoints下，这种内置方法既不方便（模型的下载源在国外，下载比较慢），也不好部署，网上也查到一些方法，包括：pytorch预训练模型的下载地址以及解决
复制链接

扫一扫

专栏目录