pytorch CPU与GPU模型参数相互加载


1. 模型保存以及加载方法

# 直接保存模型 (参数 + 网络结构)
torch.save(model, '/path/to/save')
model = torch.load('/path/to/load')
# 只保存参数 (推荐)
torch.save(model.state_dict(), '/path/to/save')
model = NET()
mode.load_state_dict(torch.load('/path/to/load'))
# 保存参数、优化器、epoch
state = {
    'model': model.state_dict(),
    'optimizer': optimizer.state_dict(),
    'epoch': epoch
}
torch.save(state, '/path/to/save')
checkpoint = torch.load('/path/to/load')
model.load_state_dict(checkpoint['model'])
optimizer.load_state_dict(checkpoint['optimizer'])
epoch = checkpoint['epoch']

2. 单 GPU 和 单 CPU 参数-模型相互加载

## CPU->CPU OR GPU->GPU 直接加载
model.load_state_dict(torch.load('/path/to/load'))

## GPU->CPU (参数->模型)
state_dict = torch.load('/path/to/load', map_location=lambda storage, loc: storage)
state_dict = torch.load('/path/to/load', map_location='cpu')

model.load_state_dict(states_dict)

## CPU->GPU (参数->模型)
state_dict = torch.load('/path/to/load', map_location=lambda storage, loc: storage.cuda)
state_dict = torch.load('/path/to/load', map_location='cuda:0')
### 指定GPU
state_dict = torch.load('/path/to/load', map_location=lambda storage, loc: storage.cuda(1))
state_dict = torch.load('/path/to/load', map_location='cuda:1')

3. 多 GPU 模型-参数

## 模型 + 参数
torch.save(model.module, '/path/to/save') # 多了个module
## 参数
torch.save(model.module.state_dict(), '/path/to/save') # 多了个module

4. 单 GPU or CPU 模型加载多 GPU 参数

## 多gpu上保存的模型在参数名前多加了一个module.前缀
device = torch.device('cpu') # cup 模型
# device = torch.device('cuda:0') # gpu 模型
model = NET().to(device)
state_dict = torch.load('/path/to/load', map_location=device)
state_dict_new = {}
for k, v in state_dict.items():
    new_k = k[7:] # 去掉键名的前七个字母,即'module.'
    state_dict_new[new_k] = v

model.load_state_dict(state_dict_new)

5. 单 GPU or CPU 加载 多GPU模型+参数

model_cpu = NET().to('cpu')
model_gpu = NET().to('cuda:0')

pretrained_model = torch.load('/path/to/load') # 模型+参数

pretrained_dict = pretrained_model.module.state_dict() # 提取参数

model_cpu.load_state_dict(pretrained_dict)
model_gpu.load_state_dicr(pretrained_dicr)

6. 多 GPU 加载 多GPU参数

model = NET().to('cuda:0')
model = torch.nn.DataParallel(model, device_ids=[0, 1])
state_dict = torch.load('/path/to/load')
model.load_state_dict(state_dict)
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值