Pytorch保存和加载模型完全指南: 关于使用Pytorch读写模型的一切方法

最新推荐文章于 2024-06-21 14:35:06 发布

miguemath

最新推荐文章于 2024-06-21 14:35:06 发布

阅读量1.5k

点赞数 6

分类专栏： Pytorch 文章标签：深度学习 pytorch 机器学习神经网络 python

本文链接：https://blog.csdn.net/wangkaidehao/article/details/104296025

版权

本文详细介绍了PyTorch中模型的保存和加载方法，包括保存和加载state_dict、整个模型、检查点，以及跨设备保存和加载。强调了state_dict的重要性和在不同场景下的使用策略，如迁移学习中的模型热启动。此外，还提到了在GPU和CPU之间进行模型保存和加载的实践指导。

摘要由CSDN通过智能技术生成

本文是一篇关于如何用Pytorch保存和加载模型的指南。

文章目录

本文主要涉及到3个函数：

torch.save: 使用Python的pickle实用程序将对象进行序列化，然后将序列化的对象保存到disk，可以保存各种对象,包括模型、张量和字典等。
torch.load: 使用pickle unpickle工具将pickle的对象文件反序列化为内存。
torch.nn.Module.load_state_dict: 用反序列化的state_dict来加载模型参数。

1 读写tensor

1.1 单个张量

import torch

x = torch.tensor([3.,4.])
torch.save(x, 'x.pt')
x1 = torch.load('x.pt')
print(x1)

输出：

tensor([3., 4.])

1.2 张量列表和张量词典

y = torch.ones((4,2))
torch.save([x,y],'xy.pt')
torch.save({
   'x':x, 'y':y}, 'xy_dict.pt')
xy = torch.load('xy.pt')
xy_dict = torch.load('xy_dict.pt')
print(xy)
print(xy_dict)

输出：

[tensor([3., 4.]), tensor([[1., 1.],
        [1., 1.],
        [1., 1.],
        [1., 1.]])]
{'x': tensor([3., 4.]), 'y': tensor([[1., 1.],
        [1., 1.],
        [1., 1.],
        [1., 1.]])}

2 保存和加载模型

2.1 state_dict

state_dict是一个从每一个层的名称映射到这个层的参数Tesnor的字典对象。

注意，只有具有可学习参数的层(卷积层、线性层等)和注册缓存(batchnorm’s running_mean)才有state_dict中的条目。优化器(torch.optim)也有一个state_dict，其中包含关于优化器状态以及所使用的超参数的信息。

from torch import nn
class MLP(nn.Module):
    def __init__(self):
        super(MLP, self).__init__()
        self.hidden = nn.Linear(3,

最低0.47元/天解锁文章

miguemath

关注

6
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录