Pytorch如何部分加载模型参数

Pytorch如何加载部分模型参数

在处理深度学习相关的任务时,有些情况下是在别人已有的模型上做了少量的更改,此时如果从头开始训练此模型,感觉很浪费时间,因为可以充分利用别人已经训练出来的模型的参数,供自己更改的模型使用。因此本文便简单分享一种方法,来加载模型的部分参数。

方法

经过查阅相关博客,发现加载模型部分参数的方法如下:

model.load_state_dict(related_params, strict=True)

strict是False时,当权重中的key和网络中匹配就加载,不匹配就跳过。如果strict是True,那必须完全匹配,不然就报错。所以如果只想加载部分的模型参数,只需要另strict参数为False即可,这样就可以将相匹配的部分加载进来

踩坑

笔者直接进行尝试后,发现会报如下错误

'model' object has no attribute 'copy'

笔者所写的代码如下所示:

newModel.load_state_dict(torch.load("model.pth"), strict=False)

这里的"model.pth",笔者在进行保存时,是使用torch.save(model, “model.pth”)直接进行保存的,因此无法进行加载。如果在保存模型时使用如下命令:

torch.save(model.state_dict(), "model.pth")

模型就可以正确地被加载进去了

原因

这其中的原因其实很简单,就是模型的保存和加载要配套使用,笔者也是在找到此篇文章后才知道的:[错误汇总]‘model’ object has no attribute 'copy’加载模型报错
简而言之,就是保存模型和加载模型要配套使用

1 直接进行模型的保存和加载:

torch.save(model, "model.pth")
newModel = torch.load("model.pth")

2 分别进行加载

torch.save(model.state_dict(), "model.pth")
newModel.load_state_dict(torch.load("model.pth"))

所以注意到配套使用,模型部分参数的加载就很容易了

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
PyTorch是一个功能强大的机器学习框架。它使用动态计算图和高效的自动微分来加速深度学习。在实际编码的过程,我们经常会使用预训练模型来加速模型训练和进一步提升模型准确率,不过一些时候我们并不需要整个预训练模型的所有参数来进行训练,而是只需要加载训练模型部分参数。那么在PyTorch,我们要如何来加载训练模型部分参数呢? 要想加载训练模型部分参数,在PyTorch,我们可以使用load_state_dict()函数实现。load_state_dict()函数在PyTorch是将参数拷贝到新模型的函数,新模型和预训练模型的网络结构应该是相同的。然后我们可以通过load_state_dict()函数的参数prefix和exclude来实现部分参数加载。prefix参数是指定了预训练模型需要加载参数的前缀,而exclude参数是指定了我们不需要加载参数。 例如,我们有一个预训练模型‘resnet18.pth’,它包含了resnet18模型在imagenet上训练好的模型参数。我们想要使用这个模型来进行一些迁移学习,那只需要加载resnet18最后一层fc层之前的所有模型参数,而不需要加载最后一层fc层的权重。那么,我们可以通过以下代码来实现: ``` import torch.utils.model_zoo as model_zoo import torchvision.models as models # 定义一个resnet18模型 resnet18 = models.resnet18(pretrained=False) # 加载训练模型的所有参数 model_url = 'https://download.pytorch.org/models/resnet18-5c106cde.pth' resnet18.load_state_dict(model_zoo.load_url(model_url)) # 获取所有要加载参数的名字 params_to_update = [] for name, param in resnet18.named_parameters(): if 'fc' not in name: params_to_update.append(name) # 加载部分训练模型参数 state_dict = model_zoo.load_url(model_url) model_dict = resnet18.state_dict() for name, value in state_dict.items(): if name.startswith(tuple(params_to_update)): model_dict.update({name: value}) resnet18.load_state_dict(model_dict) ``` 上述代码先是定义了一个resnet18模型,然后加载resnet18预训练模型的所有参数。通过获取所有需要加载参数的名字,然后将其加载到新模型,从而实现了加载训练模型部分参数的目的。 总结: 通过使用load_state_dict()函数的prefix和exclude参数,在PyTorch实现了对预训练模型部分参数加载。这将使我们在使用预训练模型时更加灵活和高效。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

INEVGVUP

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值