pytorch保存和加载模型权重的方式

最新推荐文章于 2024-09-10 18:05:24 发布

我是谁？？

最新推荐文章于 2024-09-10 18:05:24 发布

阅读量2.6w

点赞数 23

分类专栏：人工智能文章标签： pytorch 深度学习模型参数

本文链接：https://blog.csdn.net/lu_linux/article/details/113586554

版权

人工智能专栏收录该内容

64 篇文章

订阅专栏

本文介绍PyTorch中模型保存与加载的方法，包括整体模型、仅参数的保存及加载，以及如何加载预训练模型。同时介绍了不同设备间加载模型参数的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

(1) 保存和加载整个模型

# 模型保存
torch.save(model, 'model.pkl')
# 模型加载
model = torch.load('model.pkl')

这种方式无需自定义网络，保存时已把网络结构保存，比较死板，不能调整网络结构。

(2) 仅仅保存模型参数以及分别加载模型结构和参数

# 模型参数保存
torch.save(model.state_dict(), 'model_param.pkl')
# 模型参数加载
model = ModelClass(...)
model.load_state_dict(torch.load('model_param.pkl'))

这种方式需要自己定义网络，并且其中的参数名称与结构要与保存的模型中的一致（可以是部分网络，比如只使用VGG的前几层），相对灵活，便于对网络进行修改。

说明：

1.torch.load加载模型参数

2.model.load_state_dict加载模型参数到模型结构

CPU模型加载GPU参数

model.load_state_dict(torch.load('model_param.pkl', map_location='cpu'))

通过DataParalle使用多GPU

model=DataParalle(model)
#保存参数
torch.save(model.module.state_dict(), 'model_param.pkl')

(3) `pytorch加载预训练模型`

`加载预训练模型和参数`

resnet18 = models.resnet(pretrained=True)

`只加载模型，不加载预训练参数`

# 加载模型
resnet18 = models.resnet18(pretrained=False)
# 加载预先下载好的预训练模型参数
resnet18.load_state_dict(torch.load('resnet18-5c106cde.pth'))

`加载部分预训练模型`

resnet152 = models.resnet152(pretrained=True)
pretrained_dict = resnet152.state_dict()
"""加载torchvision中的预训练模型和参数后通过state_dict()方法提取参数
   也可以直接从官方model_zoo下载：
   pretrained_dict = model_zoo.load_url(model_urls['resnet152'])"""
model_dict = model.state_dict()
# 将pretrained_dict里不属于model_dict的键剔除掉
pretrained_dict = {k: v for k, v in pretrained_dict.items() if k in model_dict}
# 更新现有的model_dict
model_dict.update(pretrained_dict)
# 加载我们真正需要的state_dict
model.load_state_dict(model_dict)

参考：

https://www.cnblogs.com/leebxo/p/10920134.html