pytorch加载预训练模型、微调、以及现有模型中加入自己的层、为不同层设置不同的参数更新

**加载预训练:**分为两种
1.加载自己之前训练的模型。

pretrained_params = torch.load('Pretrained_Model')
model = New_Model(xxx)
model.load_state_dict(pretrained_params.state_dict(),strict=False)

2.加载pytorch中模型
以残差网络18为例

import torchvision.models as models
resnet18 = models.resnet18(pretrained=True)
pretrained_dict = resnet18.state_dict()
model_dict = new_model.state_dict()
# 将pretrained_dict里不属于model_dict的键剔除掉
pretrained_dict =  {k: v for k, v in pretrained_dict.items() if k in model_dict  and v.shape ==model_dict[k].shape}
# 更新现有的model_dict
model_dict.update(pretrained_dict)
# 加载我们真正需要的state_dict
new_model.load_state_dict(model_dict)

微调:

for name, value in model.named_parameters():
    if name 你需要固定的层:
        value.requires_grad = False
        
params = filter(lambda p: p.requires_grad, model.parameters())
optimizer = torch.optim.Adam(params, lr=1e-5)

如果你不知道你需要固定层的名字可通过:

print(model.state_dict().keys())

现有模型中加入自己的层:
1.首先新建自己的模型
2.将现有模型参数加载进入
以加载的ResNet18为例

import torchvision.models as models
resnet18 = models.resnet18(pretrained=True)
pretrained_dict = resnet18.state_dict()
model_dict = new_model.state_dict()
# 将pretrained_dict里不属于model_dict的键剔除掉
pretrained_dict =  {k: v for k, v in pretrained_dict.items() if k in model_dict  and v.shape ==model_dict[k].shape}
# 更新现有的model_dict
model_dict.update(pretrained_dict)
# 加载我们真正需要的state_dict
new_model.load_state_dict(model_dict)

为不同层设置不同的参数更新:
假设要求encode等层学习率为1e-5, 而decoder层的学习率为1e-3,1.我们需要先将解码层decoder的参数提取出来
2.通过filter过滤得其它层的参数,然后将他们数组方式传入优化器中。

ignored_params = list(map(id, model.decoder.parameters()))
base_params = filter(lambda p: id(p) not in ignored_params, model.parameters())
optimizer = torch.optim.Adam([{'params':base_params,'lr':1e-5},                              {'params':model.decoder.parameters()}],lr=1e-3, momentum=0.8)                         
  • 17
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值