【pytorch】多GPU训练模型的保存和加载

最新推荐文章于 2024-06-07 21:58:44 发布

阿委困的不能行

最新推荐文章于 2024-06-07 21:58:44 发布

阅读量1.3k

点赞数 2

文章标签： pytorch 深度学习 python

原文链接：https://blog.csdn.net/qq_39129717/article/details/124613026

版权

原文链接：https://blog.csdn.net/qq_39129717/article/details/124613026
pytorch将模型加载到多gpu上的时候，会用到：

model = torch.nn.DataParallel(model).cuda()
#或者
model = torch.nn.DataParallel(model, device_ids=[1, 2, 3])

多GPU在直接保存模型的时候，如果直接：

torch.save(model.state_dict(), save_dict_path)

加载后的模型参数每个都会带有 module

如果使用strict=False的加载方式，很有可能会使测试结果不同：

model.load_state_dict(weights_dict, strict=False)

解决方法1：

在保存模型的时候使用model.module保存：

torch.save(model.module.state_dict(), save_dict)

加载的时候可直接加载，比如：

checkpoint = torch.load('./weight/BigDtat_BLoss6_0.83.pth', map_location='cpu')
model.load_state_dict(checkpoint)
model.cuda()

解决方法2：

如果模型已经保存，将模型参数字典中的module替换为空字串进行加载：

checkpoint = torch.load(weight_pth, map_location='cpu')
model.load_state_dict({k.replace('module.', ''): v for k, v in checkpoint.items()})
model.load_state_dict(checkpoint)
model = model.cuda()

不要使用model.load_state_dict(weights_dict, strict=False)这种方式，会造成预测预测结果发生变换。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阿委困的不能行

关注关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
3
评论
【pytorch】多GPU训练模型的保存和加载

pytorch中多GPU模型加载和保存需要注意的一些问题
复制链接

扫一扫

解决pytorch多GPU训练保存的模型,在单GPU环境下加载出错问题

09-16

主要介绍了解决pytorch多GPU训练保存的模型,在单GPU环境下加载出错问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

pytorch----模型参数的保存与加载

qq_38055396的博客

04-06

1334

网络模型的保存与加载 1.单纯保存网络模型参数，一条语句即可 torch.save(model.state_dict(), path) # 其中path=’./model.pth’ , path=’./model.tar’, path=’./model.pkl’ # 保存参数的文件一定要有后缀扩展名。 model.load_state_dict(torch.load(path)) 2.还想保存训练采用的优化器、epoch信息等 state = { 'model': model.state_dict

3 条评论您还未登录，请先登录后发表或查看评论

pytorch使用DataParallel并行化保存和加载模型（单卡、多卡各种情况讲解）

最新发布

小白冲鸭的博客

06-07

693

话不多说，直接进入正题。！！！不过要注意一点，本文保存模型采用的都是，而不是保存整个模型的情况。一定要看清楚再用啊！

pytorch 多卡训练，模型保存的一些问题

2401_83817148的博客

04-08

257

第二步：定义模型，并将模型放入device。如果环境中有多张显卡，则使用torch.nn.DataParallel方法加载模型，实现多卡训练。第四步：保存模型，判断是否是多张显卡训练出来的模型。如果是多张显卡训练的模型则要保存model.module。第一步：检查环境内是否有cuda环境，如果有则将device 设置为cuda:0，如果没有则设置为cpu。第三步：将数据放入device中。数据默认加载到第一张显卡上。接下来，我们看看多显卡训练过程和单显卡有何不同。以上前端开发知识点，真正体系化！

pytorch：多GPU训练、保存加载参数、测试

zhangqiqiyihao的博客

05-01

1355

一、使用pytorch进行多GPU训练的需要添加的代码： #设置使用哪些显卡，我这里用所有可用的 device_ids=range(torch.cuda.device_count()) model = Transformer().cuda() model = nn.DataParallel(model, device_ids=device_ids) 二、保存和加载参数 #加载参数 model.load_state_dict(torch.load('模型参数/两条130数值的测试用的模型参数.pkl'))

多GPU下训练时保存模型

XSXBZDQ的博客

07-24

511

多GPU训练时的模型保存

pytorch--多卡单卡模型加载

qq_43509393的博客

08-09

858

pytorch多卡单卡模型加载一、⇒load to \xRightarrow{load \ to\ }load to 单卡二、⇒load to \xRightarrow{load \ to\ }load to 多卡三、使用 \quad模型的保存和加载参照 pytorch模型保存及加载详解 \quad多卡保存的时候，在model的state_dict()参数多了一个"moudle."的前缀，其他的参数保存的时候单卡多卡保存

Pytorch加载部分预训练模型的参数实例

09-18

例如，如果我们有一个名为DPN的模型，我们可以创建该模型实例，然后使用`load_state_dict()`函数加载保存的模型状态字典。以下是一个简单的例子： ```python model = DPN(*args, **kwargs) model.load_state_dict...

基于pytorch的保存和加载模型参数的方法

09-18

在PyTorch中，保存和加载模型参数是训练过程中至关重要的步骤，这使得我们能够持久化模型，并在后续使用时避免重复训练。本篇文章将详细解释两种不同的方法，以帮助你理解和实施这些操作。 ### 方式一：保存与加载...

pytorch多GPU并行运算的实现

09-18

PyTorch 提供了在多GPU上并行运算的功能，这极大地加快了模型的训练速度。本文将详细介绍如何在 PyTorch 中实现多GPU并行运算，并提供一些实战中的注意事项。首先，确保你的系统已经正确安装了 PyTorch 和 CUDA，...

解决pytorch多GPU训练的模型加载问题

Lily的博客

06-07

1125

由于多GPU训练使用了 nn.DataParallel(net, device_ids=gpu_ids) 对网络进行封装，因此在原始网络结构中添加了一层module。网络结构如下：而不使用多GPU训练的网络结构如下：重点多GPU训练好的模型，单GPU 如何正确加载方法一：（训练的时候必须写好的不同保存模式）或者写入字典方法二：无论有几个GPU 都按并行的方式加载即可，一个也可以，不影响或者字典中的加载参考链接： [1]https://blog.csdn.net/anshiquanshu/a

Pytorch distributed 多卡并行载入模型

Orientliu96的博客

03-06

1144

Pytorch distributed 多卡并行载入模型前面的博客介绍了pytorch多卡distribute的方法，这次来介绍下如何载入模型。目前没有找到官方的distribute 载入模型的方式，所以采用如下方式。大部分情况下，我们在测试时不需要多卡并行计算。所以，我在测试时只使用单卡。 from collections import OrderedDict device = tor...

（深度学习）pytorch中模型的保存、加载、续训练以及多模型同文件保存方法

weixin_64388392的博客

11-25

2559

pytorch中神经网络模型的保存、加载、续训练以及多模型同文件的保存方法

pytorch 多卡并行载入部分网络模型

Orientliu96的博客

02-29

685

pytorch 多卡并行载入部分网络模型我们在做深度学习的时候经常会使用预训练的模型。但是一旦自己修改了网络架构，就无法load pretrained model。因为模型文件保存的参数，有一部分是不需要的，或者有一部分参数是缺失的。为了在这种情况下，成功导入模型，我们需要如下操作操作的前提是我们存在已保存的模型参数 model = Net() torch.save(model.state...

Error(s) in loading state_dict for ModelMain

jacke121的专栏

08-01

5745

原代码： net = ModelMain(config, is_training=is_training) net.train(is_training) net = nn.DataParallel(net) net = net.cuda() Error(s) in loading state_dict for ModelMain 原因： cuda版的torch，把代码去掉...

PyTorch模型保存与加载