pytorch：多GPU训练、保存加载参数、测试

最新推荐文章于 2023-12-22 12:25:44 发布

y hat

最新推荐文章于 2023-12-22 12:25:44 发布

阅读量1.3k

点赞数 1

分类专栏： pytorch学习

本文链接：https://blog.csdn.net/zhangqiqiyihao/article/details/116330583

版权

pytorch学习专栏收录该内容

13 篇文章 1 订阅

订阅专栏

一、指定使用单块gpu训练

os.environ["CUDA_VISIBLE_DEVICES"] = '1'

二、使用pytorch进行多GPU训练的需要添加的代码：

#设置使用哪些显卡，我这里用所有可用的
device_ids=range(torch.cuda.device_count())
model = Transformer().cuda()
model = nn.DataParallel(model, device_ids=device_ids)

三、保存和加载参数

#加载参数
model.load_state_dict(torch.load('模型参数/两条130数值的测试用的模型参数.pkl'))
#保存参数
torch.save(model.state_dict(), '模型参数/两条130数值的测试用的模型参数.pkl')

四、多GPU加载参数后测试：

# Test
enc_inputs = next(iter(loader))
greedy_dec_input = greedy_decoder(model, enc_inputs[0].view(1, -1).cuda(), start_value=enc_inputs[0][-1])
predict = model.module(enc_inputs[0].view(1, -1).cuda(), greedy_dec_input)
print(predict)

会有如下报错：
AttributeError: ‘DataParallel’ object has no attribute ‘encoder’

因为加载参数时，model = nn.DataParallel(model, device_ids=device_ids)，model等于了nn.dataparallel,在操作原始模型的时候需要将model换为model.module

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

y hat

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Pytorch加载多GPU模型预测

qq_16542771的博客

10-08

3841

Pytorch加载多GPU模型预测Load模型参数Load数据 Load模型参数使用多GPU训练的模型在save时参数字典会键会添加model.关键字，在CPU或者单GPU使用时会引发错误Unexpected key(s) in state_dict: “module.features. …”.，Expected “.features…”。在保存时用如下语句可解决： torch.save(mod...

Pytorch：入门指南和 PyTorch 的 GPU版本安装(非常详细)

Jingmin Wei's Blog

02-03

3508

介绍了该教程的入门指南，环境配置参考，开发工具推荐，详细讲解了PyTorch的GPU版本安装方式，以及如何使用 GPU 。

参与评论您还未登录，请先登录后发表或查看评论

Pytorch中实现只导入部分模型参数的方式

09-18

今天小编就为大家分享一篇Pytorch中实现只导入部分模型参数的方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

【pytorch】多GPU训练模型的保存和加载

rocking_struggling的博客

08-09

1445

pytorch中多GPU模型加载和保存需要注意的一些问题

使用Pytorch在多GPU下保存和加载训练模型参数遇到的问题

Cloris_Sue的博客

11-09

1982

原文转载至https://www.cnblogs.com/jinjunweina/p/12671833.html 使用Pytorch在多GPU下保存和加载训练模型参数遇到的问题最近使用Pytorch在学习一个深度学习项目，在模型保存和加载过程中遇到了问题，最终通过在网卡查找资料得已解决，故以此记之，以备忘却。首先，是在使用多GPU进行模型训练的过程中，在保存模型参数时，应该使用类似如下代码进行保存： torch.save({ 'epoch': epoch,

ML多GPU训练好的网络模型参数如何保存？

Kp0fS的草稿纸

10-08

269

坑：ML多GPU训练好的网络模型参数如何保存？，我发现，网络参数的结构都发生了变化。再Load的时候，已经load不进来了这里有两个策略：第一个：找找有没有解决方案这里有一个解决方案可以参考： https://blog.csdn.net/m0_37477175/article/details/83378464 def get_model(input_shape): . ...

pytorch多GPU训练以及多线程加载数据

热门推荐

daniaokuye的专栏

01-22

2万+

更正说明：时间 2018/01/23 现在我所测试得到的dataParallel只能有效的进行前向传播，不能后向传播。下面的关于后向传播的原因我没有在代码层面进行分析，所以下面的记录部分（前面传播）是正确的。不过可以得出的结论有：Dataparallel不支持自动的后向传播；Variable的grad_fn不能修改；Variable只有叶节点（在pytorch中计算图的倒着来的，叶节点就

cpu并行和gpu并行_pytorch多gpu并行训练

weixin_39951930的博客

11-20

1333

目录目录pytorch多gpu并行训练1.单机多卡并行训练1.1.torch.nn.DataParallel1.2.如何平衡DataParallel带来的显存使用不平衡的问题1.3.torch.nn.parallel.DistributedDataParallel2.多机多gpu训练2.1.初始化2.1.1.初始化backend2.1.2.初始化init_method2.1.2.1.使用TCP初始...

Pytorch：卷积神经网络-预训练网络微调

Jingmin Wei's Blog

02-04

1264

微调预训练的VGG网络，识别十类猴子

pytorch 获取模型参数_[日常] PyTorch 预训练模型，保存，读取和更新模型参数以及多 GPU 训练模型...

weixin_39610759的博客

12-21

305

本文用于记录如何进行 PyTorch 所提供的预训练模型应如何加载，所训练模型的参数应如何保存与读取，如何冻结模型部分参数以方便进行 fine-tuning 以及如何利用多 GPU 训练模型。(各位收藏的时候, 麻烦顺手点个赞同吧)目录PyTorch 预训练模型保存模型参数读取模型参数冻结部分模型参数，进行 fine-tuning模型训练与测试的设置利用 torch.nn.DataParallel...

pytorch多GPU训练模型保存及加载

F_aF_a的博客

08-26

582

参考链接 https://pytorch.org/tutorials/beginner/former_torchies/parallelism_tutorial.html#dataparallel https://blog.csdn.net/wumo1556/article/details/89065916

pytorch单GPU模型加载多GPU保存的参数

read, note and comment papers

11-24

1091

from collections import OrderedDict state_dict = torch.load(para_path) new_state_dict = OrderedDict() for k, v in state_dict.items(): name = k[7:] # remove `module.` new_state_dict[name] = v net.load_state_dict(new_state_dict)

pytorch多gpu数据并行

cyj5201314的博客

08-16

218

import torch import torch.nn as nn from torch.utils.data import DataLoader, Dataset input_size = 5#模型输入和输出维度 output_size = 2 batch_size = 40 #批量 data_size = 1000 #样本数量 device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") class Random

pytorch快速上手（9）-----多GPU数据并行训练方法

All_In_gzx_cc的博客

07-15

4047

单机多GPU可以使用torch.nn.DataParallel接口(DP,旧的)或者torch.nn.parallel.DistributedDataParallel接口(DDP，新的)，官方推荐使用第二个，多机多卡的情况下只能使用DDP。进行分布式训练，distributed会在内部开辟多个进程，进程数与可用的GPU数一致，多个进程分别加载数据集的一部分，在每个GPU上实现加载部分数据集的前向与反向传播，多个GPU上的反向传播得到的梯度会通过gpu间的。最后还有一步，启用多进程运行。...

pytorch 多卡训练，模型保存的一些问题

AI浩

03-10

2882

单显卡先看单显卡如何实现训练：第一步：检查环境内是否有cuda环境，如果有则将device 设置为cuda，如果没有则设置为cpu device = torch.device("cuda" if torch.cuda.is_available() else "cpu") 第二步：定义模型，并将模型放入device。 model = mobilenet_v3_large(pretrained=True) model.to(DEVICE) 第三步：将数据放入device中 for batch_idx

Pytorch：多GPU训练网络与单GPU训练网络保存模型的区别

huangpg丶计算机视觉算法工程师之路

12-05

5060

测试环境：Python3.6 + Pytorch0.4 在pytorch中，使用多GPU训练网络需要用到【nn.DataParallel】： gpu_ids = [0, 1, 2, 3] device = t.device("cuda:0" if t.cuda.is_available() else "cpu") # 只能单GPU运行 net = LeNet() if len(gpu...

torch多GPU导致较大计算误差问题

Bruc_e__的博客

11-21

1119

torch多GPU导致较大计算误差问题

Pytorch 加载多gpu模型+解决加载模型测试结果不正确

sd-lz的博客

05-06

2345

将模型加载到多gpu上的时候，会用到 model = torch.nn.DataParallel(model, device_ids=[1, 2, 3]) 因此在保存模型的时候，若直接 torch.save(model.state_dict(), save_dict_path) 加载后的模型参数每个都会带有 module 如果使用strict=False的加载方式，很有可能会使测试结果不同 model.load_state_dict(weights_dict, strict=False)

关于YOLOv5的训练，GPU单卡、多卡设置，加速训练

最新发布

qq_44442727的博客

12-22

6661

yolov5毫无疑问是目前目标检测框架中非常准确快速的检测框架之一，在工业界和学术界应用广泛，其优势不言而喻。在模型训练或推理时，我们都想快速完成，特别是数据量很大的时候，效率就是非常迫切需要提升的。这里简单介绍一下yolov5的多种训练方法，便于理解深度学习的模型训练方法，同时基于自身的硬件条件选择高效的训练方法。如果条件允许，首推的是多卡DDP训练模式。

pytorch模型加载测试_pytorch模型加载方法汇总

06-02

当你构建好PyTorch模型并训练完成后，需要把模型保存下来以备后续使用。这时你需要学会如何加载这个模型，以下是PyTorch模型加载方法的汇总。 ## 1. 加载整个模型 ```python import torch # 加载模型 model = torch.load('model.pth') # 使用模型进行预测 output = model(input) ``` 这个方法可以轻松地加载整个模型，包括模型的结构和参数。需要注意的是，如果你的模型是在另一个设备上训练的（如GPU），则需要在加载时指定设备。 ```python # 加载模型到GPU device = torch.device('cuda') model = torch.load('model.pth', map_location=device) ``` ## 2. 加载模型参数如果你只需要加载模型参数，而不是整个模型，可以使用以下方法： ```python import torch from model import Model # 创建模型 model = Model() # 加载模型参数 model.load_state_dict(torch.load('model.pth')) # 使用模型进行预测 output = model(input) ``` 需要注意的是，这个方法只能加载模型参数，而不包括模型结构。因此，你需要先创建一个新的模型实例，并确保它的结构与你保存的模型一致。 ## 3. 加载部分模型参数有时候你只需要加载模型的部分参数，而不是全部参数。这时你可以使用以下方法： ```python import torch from model import Model # 创建模型 model = Model() # 加载部分模型参数 state_dict = torch.load('model.pth') new_state_dict = {} for k, v in state_dict.items(): if k.startswith('layer1'): # 加载 layer1 的参数 new_state_dict[k] = v model.load_state_dict(new_state_dict, strict=False) # 使用模型进行预测 output = model(input) ``` 这个方法可以根据需要选择加载模型的部分参数，而不用加载全部参数。 ## 4. 加载其他框架的模型如果你需要加载其他深度学习框架（如TensorFlow）训练的模型，可以使用以下方法： ```python import torch import tensorflow as tf # 加载 TensorFlow 模型 tf_model = tf.keras.models.load_model('model.h5') # 将 TensorFlow 模型转换为 PyTorch 模型 input_tensor = torch.randn(1, 3, 224, 224) tf_output = tf_model(input_tensor.numpy()) pytorch_model = torch.nn.Sequential( # ... 构建与 TensorFlow 模型相同的结构 ) pytorch_model.load_state_dict(torch.load('model.pth')) # 使用 PyTorch 模型进行预测 pytorch_output = pytorch_model(input_tensor) ``` 这个方法先将 TensorFlow 模型加载到内存中，然后将其转换为 PyTorch 模型。需要注意的是，转换过程可能会涉及到一些细节问题，因此可能需要进行一些额外的调整。 ## 总结 PyTorch模型加载方法有很多，具体要根据实际情况选择。在使用时，需要注意模型结构和参数的一致性，以及指定正确的设备（如GPU）。