Pytorch预训练模型的部分导入

需求描述

在large-scale数据集上进行的预训练模型上进行具体任务的炼丹已经非常常见了,只不过我们可能的最后的任务不同。例如在ImageNet上的预训练模型最后一层是维度为1000的全连接层,但如果我们使用MiniImageNet,则类别只有100.因为导入预训练模型时,全连接层无法进行导入。直接使用model.load_state_dict()函数会出现如下问题

RuntimeError: Error(s) in loading state_dict for VisionTransformerDiffPruning:
        size mismatch for head.weight: copying a param with shape torch.Size([1000, 384]) from checkpoint, the shape in current model is torch.Size([100, 384]).
        size mismatch for head.bias: copying a param with shape torch.Size([1000]) from checkpoint, the shape in current model is torch.Size([100]).

解决方案

方案则是:model.load_state_dict()提供了加载部分预训练模型的选择


#加载model,mymodel是自己定义好的模型
pretrainedmodel = models.resnet50(pretrained=True) 
mymodel =Net(...) 
 
#读取参数 
pretrained_dict =pretrainedmodel.state_dict() 
model_dict = mymodel.state_dict() 
 
#将pretrained_dict里不属于model_dict的键剔除掉 
pretrained_dict =  {k: v for k, v in pretrained_dict.items() if k in model_dict} 
 
# 更新现有的model_dict 
model_dict.update(pretrained_dict) 
 
# 加载我们真正需要的state_dict 
model.load_state_dict(model_dict)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值