pytorch调用不了多个gpu_使用Pytorch在多GPU下保存和加载训练模型参数遇到的问题...

最新推荐文章于 2023-02-17 05:01:50 发布

谷桐羽

最新推荐文章于 2023-02-17 05:01:50 发布

阅读量391

点赞数

文章标签： pytorch调用不了多个gpu

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_26824299/article/details/111964864

版权

本文记录了在使用PyTorch进行深度学习项目时遇到的模型保存和加载问题。在多GPU环境下，保存模型时需使用`model.module.state_dict()`，而在加载时若直接使用`model.load_state_dict()`会导致错误。解决方案包括重新训练模型或在加载前修改state_dict去除"module"前缀。

摘要由CSDN通过智能技术生成

最近使用Pytorch在学习一个深度学习项目，在模型保存和加载过程中遇到了问题，最终通过在网卡查找资料得已解决，故以此记之，以备忘却。

首先，是在使用多GPU进行模型训练的过程中，在保存模型参数时，应该使用类似如下代码进行保存：

torch.save({

'epoch': epoch,

'state_dict': model.module.state_dict(),

'optimizer': optimizer.state_dict()

}, 'results/checkpoint_net.pth')

对应的在加载模型参数时，使用如下代码进行加载是没有问题的：

checkpoint = torch.load('./results/checkpoint_net.pth')

model.load_state_dict(checkpoint['model'])

一般情况下，在保存模型时我们不会发现会有什么不对，而是在需要加载模型参数时，才发现加载报错了。比如：

这时我们需要回头检查我们在保存模型参数时，是否有哪里不对。比如我这次就是这样的，写代码的时候并没有考虑到多GPU的情况，所以保存代码如下：

torch.save({

'epoch': epoch,

'state_dict': model.state_dict(),

'optimizer': optimizer.state_dict()

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。