多GPU训练，加载模型测试

最新推荐文章于 2024-08-09 18:33:22 发布

dpai_ch

最新推荐文章于 2024-08-09 18:33:22 发布

阅读量489

点赞数 11

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/dpai_ch/article/details/135700707

版权

该段代码展示了如何从保存的模型状态字典中加载预训练模型到GPU，然后使用DataParallel进行多GPU并行，最后将模型转换为单GPU模式并设置为评估模式。

摘要由CSDN通过智能技术生成

state_dict = torch.load(self._model_path).cuda()
model = nn.DataParallel(model)
model.load_state_dict(state_dict.state_dict())
model_single_gpu = model.module
model_single_gpu.eval()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dpai_ch

关注关注

11
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

多GPU训练网络模型——数据并行（DataParallel、DistributedDataParallel）

Billie使劲学的博客

07-14

947

分布式：分布式是指使用多台服务器的多块GPU进行运算，即多机多卡。并行：并行是指使用一台服务器的多个GPU运算，即单机多卡。

Keras下使用多GPU训练模型

Micheal 超的博客

11-09

835

Keras 2.X版本后可以很方便的支持使用多GPU进行训练了，使用多GPU可以提高我们的训练过程，比如加速和解决内存不足问题。我的tensorflow_gpu=1.15.0; Keras==2.1.6 涉及的代码设置可以使用的GPU编号 import os os.environ["CUDA_VISIBLE_DEVICES"] = "2,3" # 仅让id=2，3的GPU可被使用当你的电脑中有多块GPU时, keras.utils.multi_gpu_model 中提供有内置函数，该函数可以产生任意

1 条评论您还未登录，请先登录后发表或查看评论

在服务器上多GPU训练模型，但是在本地想测试，没有GPU的方法

qq_38376205的博客

11-21

1122

方法1 ：在多个GPU上进行模型训练的时候，主要在模型那里多下面的两行代码， os.environ['CUDA_VISIBLE_DEVICES'] = '4,5,6,7' （在最开始的时候） self.model = nn.DataParallel(self.model)（在模型定义的时候）在本地CPU上，加载模型的时候，因为已经使用模型保存了模型nn.DataParallel，该模型将模型存储在该模型中module，而现在正试图加载模型DataParallel。可以nn.DataParall

使用autodl服务器，两个3090显卡上运行， Yi-34B-Chat-int4模型，并使用vllm优化加速，显存占用42G，速度23 words/s

freewebsys的专栏

12-01

3707

使用autodl服务器，两个3090显卡上运行， Yi-34B-Chat-int4模型，并使用vllm优化加速，显存占用42G，速度23 words/s。随着大模型的参数增加，企业用户再使用的是特别需要大参数的模型了。因为大模型在更加准确。硬件都不是问题。通过多卡的方式可以成功部署。2张 3090，或者 4090 就可以部署 Yi-34B-Chat-int4模型了。但是目前看中文稍微有点小问题，会返回英文，相信很快会迭代下一个版本了。

使用AutoDL服务器进行模型训练

热门推荐

弗兰-随风小欢的博客

02-12

2万+

【目标检测实验系列】AutoDL线上GPU服务器租用流程以及如何用Pycharm软件远程连接服务器进行模型训练（以Pycharm远程训练Yolov5项目为例子超详细）

如何租用AutoDL显卡进行模型训练（不支持K8s部署）

qq_33934427的博客

03-06

7642

如何租用AutoDL显卡跑项目使用步骤 1、租用新实例参考AutoDL-GPU租用平台使用教程，AutoDL快速开始 2、安装个人版XShell 7 + xftp7，注意要先下XShell，再下载xftp，否则xftp下载时会报-1603致命错误。参考XShell安装 3、使用XShell连接服务器，使用xftp上传代码到/root/auto-tmp下，因为根目录是系统盘（20G），auto-tmp为挂载盘（100G） 4、创建并激活虚拟环境：（不建议直接在root下装环境） cond

【Pytorch】pytorch使用多张GPU进行训练以及测试调用模型

qq_44747572的博客

05-07

1770

@【TOC】使用多张GPU进行训练的代码 os.environ["CUDA_VISIBLE_DEVICES"] = "0,1,2,3" device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") print(device) model = getModel(args) if torch.cuda.device_count() > 1: print("Let's use", torch.cuda.device_c

在多个GPU上训练的模型，在CPU上加载

qq_41883764的博客

08-06

1751

在服务器上使用两块显卡训练的模型，训练代码中有这句 model = torch.nn.DataParallel(model).cuda() 在自己的电脑上加载模型的时候，因为电脑只有CPU,所以需要在加载时指明cpu checkpoint = torch.load(args.model, map_location='cpu') 然后报错“unexpected module.conv.weight…” 然后在下面这句话中加入strict=False model.load_state_dict(checkp

用GPU训练的模型在测试时如何正确设置使用GPU进行测试

OneDot_的博客

10-27

1283

使用GPU训练的模型在检测时报错，输入和权重类型不同，问题是出现在了哪里呢？

pytorch 使用单个GPU与多个GPU进行训练与测试的方法

09-18

今天小编就为大家分享一篇pytorch 使用单个GPU与多个GPU进行训练与测试的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

Pytorch加载多GPU模型预测

qq_16542771的博客

10-08

3841

Pytorch加载多GPU模型预测Load模型参数Load数据 Load模型参数使用多GPU训练的模型在save时参数字典会键会添加model.关键字，在CPU或者单GPU使用时会引发错误Unexpected key(s) in state_dict: “module.features. …”.，Expected “.features…”。在保存时用如下语句可解决： torch.save(mod...

CUDA 多GPU调用实现

DreamerZhang的专栏

03-06

8977

当设备存在多块GPU时，为了高效利用GPU，我们常常需要使用多卡计算。本例中我们使用OpenMP来进行多线程调用多GPU运行，初学者无须详细了解OpenMP，只需知道一两句命令就行。详细步骤如下： 1、建立一个普通CUDA项目： 2、在项目属性C/C++设置语言：支持openMP 3、在CUDA C/C++中设置预编译命令：-Xcompiler "/openm...

weixin_29346059的博客

05-03

1万+

PyTorch指定单GPU和多GPU训练及保存-加载模型(含CPU)的总结

baidu_24215735的博客

10-21

1万+

注意：训练/测试过程中 inputs 和 labels 均需加载到GPU中。参考和综合了网上的多种方法。 1. PyTorch使用指定GPU训练 - 单GPU 直接使用代码 model.cuda(), PyTorch默认从0开始的单GPU: model = Model() if torch.cuda.is_available(): model = model.cuda() 有两种方法可直接指定单GPU: 在终端shell：CUDA_VISIBLE_DEVICES=1 python main.p

部署YOLOV5环境到服务器进行多GPU训练

CSDN1621564706的博客

06-09

1225

点我访问AutoDl官网点我访问torch官网在服务器中安装python扩展因为代码我们在本地已经跑通了，所以直接运行train.py即可进行默认单GPU训练：

Autodl训练过程

llf000000的博客

01-08

448

一般用的是RTX A5000 * 1卡。如果第二天那个容器实例没有足够的GPU，我重新创建一个容器实例，还是使用相同的卡。随机数种子一般设置为42。

使用网上服务器（AutoDL）训练模型

m0_68382801的博客

10-31

8931

租服务器（AutoDL）训练网络模型

如何使用GPU训练LSTM模型

05-05

使用GPU训练LSTM模型需要安装CUDA和cuDNN，这是NVIDIA提供的用于GPU加速的工具。安装后，您可以使用深度学习框架（如TensorFlow或PyTorch）来编写LSTM模型，并将其配置为在GPU上进行训练。以下是使用TensorFlow在GPU上训练LSTM模型的简单步骤： 1. 安装CUDA和cuDNN。 2. 安装TensorFlow并确保它可以访问GPU。您可以使用以下命令验证： ``` import tensorflow as tf tf.test.is_gpu_available() ``` 3. 加载数据集并准备数据。这通常涉及将数据转换为张量，并将其拆分为训练集和测试集。 4. 构建LSTM模型。您可以使用TensorFlow中的 `tf.keras.layers.LSTM` 层来构建模型。 5. 编译模型并指定优化器和损失函数。 6. 调用 `model.fit()` 函数来训练模型，将 `epochs` 参数设置为所需的训练次数。以下是一个简单的示例代码，演示了如何使用TensorFlow在GPU上训练LSTM模型： ``` import tensorflow as tf from tensorflow.keras.layers import LSTM, Dense # 加载数据集并准备数据 # ... # 构建模型 model = tf.keras.Sequential([ LSTM(64, input_shape=(None, input_dim)), Dense(output_dim, activation='softmax') ]) # 编译模型 model.compile(optimizer='adam', loss='categorical_crossentropy') # 在GPU上训练模型 with tf.device('/GPU:0'): model.fit(x_train, y_train, epochs=10, batch_size=32) ``` 请注意，训练LSTM模型需要大量的计算资源和时间。使用GPU可以显著加速训练过程，但仍需要耐心等待模型训练完成。