pytorch加载保存查看checkpoint文件

最新推荐文章于 2024-06-04 10:06:59 发布

joyce_peng

最新推荐文章于 2024-06-04 10:06:59 发布

阅读量3.7w

点赞数 50

分类专栏： # 深度学习框架文章标签：深度学习 pytorch

本文链接：https://blog.csdn.net/joyce_peng/article/details/104133594

版权

深度学习框架专栏收录该内容

13 篇文章 0 订阅

订阅专栏

保存方式和加载方式–3种
跨gpu和cpu保存加载
查看checkpoint文件内容
常见问题–多gpu

1. 保存加载checkpoint文件

# 方式一：保存加载整个state_dict（推荐）
# 保存
torch.save(model.state_dict(), PATH)
# 加载
model.load_state_dict(torch.load(PATH))
# 测试时不启用 BatchNormalization 和 Dropout
model.eval()

# 方式二：保存加载整个模型
# 保存
torch.save(model, PATH)
# 加载
model = torch.load(PATH)
model.eval()

# 方式三：保存用于继续训练的checkpoint或者多个模型
# 保存
torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            ...
            }, PATH)
# 加载
checkpoint = torch.load(PATH)
start_epoch=checkpoint['epoch']
model.load_state_dict(checkpoint['model_state_dict'])
# 测试时
model.eval()
# 或者训练时
model.train()

2. 跨gpu和cpu

# GPU上保存，CPU上加载
# 保存
torch.save(model.state_dict(), PATH)
# 加载
device = torch.device('cpu')
model.load_state_dict(torch.load(PATH, map_location=device))
# 如果是多gpu保存，需要去除关键字中的module，见第4部分

# GPU上保存，GPU上加载
# 保存
torch.save(model.state_dict(), PATH)
# 加载
device = torch.device("cuda")
model.load_state_dict(torch.load(PATH))
model.to(device)

# CPU上保存，GPU上加载
# 保存
torch.save(model.state_dict(), PATH)
# 加载
device = torch.device("cuda")
# 选择希望使用的GPU
model.load_state_dict(torch.load(PATH, map_location="cuda:0"))  
model.to(device)

3. 查看checkpoint文件内容

# 打印模型的 state_dict
print("Model's state_dict:")
for param_tensor in model.state_dict():
    print(param_tensor, "\t", model.state_dict()[param_tensor].size())

4. 常见问题

多gpu
报错为KeyError: ‘unexpected key “module.conv1.weight” in state_dict’
原因：当使用多gpu时，会使用torch.nn.DataParallel，所以checkpoint中有module字样

解决1：加载时将module去掉
# 创建一个不包含`module.`的新OrderedDict
from collections import OrderedDict
new_state_dict = OrderedDict()
for k, v in state_dict.items():
    name = k[7:] # 去掉 `module.`
    new_state_dict[name] = v
# 加载参数
model.load_state_dict(new_state_dict)

# 解决2：保存checkpoint时不保存module
torch.save(model.module.state_dict(), PATH)

参考链接：
https://www.jianshu.com/p/4905bf8e06e5
https://blog.csdn.net/LXYTSOS/article/details/90639524

joyce_peng

关注

50
点赞
踩
232

收藏

觉得还不错? 一键收藏
2
评论
pytorch加载保存查看checkpoint文件

目录保存方式加载方式查看checkpoint文件内容保存checkpoint文件
复制链接

扫一扫

专栏目录