pytorch使用DataParallel加速（包括RNN疑难杂症处理）

最新推荐文章于 2023-09-15 15:21:55 发布

AnUnverse

最新推荐文章于 2023-09-15 15:21:55 发布

阅读量2k

点赞数 4

分类专栏：随笔文章标签： python pytorch DataParallel

本文链接：https://blog.csdn.net/AnUnverse/article/details/119177615

版权

DataParallel的基本使用方法很简单，只需设置device_ids即可，如下所示：

device_ids = [0, 1, 2, 3]
model = torch.nn.DataParallel(model, device_ids=device_ids)

device_ids为你要使用的GPU号。如果你未使用DataParallel之前用的便是单GPU进行训练，那么对于数据不需要额外的操作，否则，你需要将模型的输入数据转移到cuda上，如：

# 此处device与device_ids无关，你可以设置device = torch.device("cuda:0")
input = input.to(device)

如果顺利的话，简单的两步就可以实现加速了。

然而，由墨菲定律可得：凡是可能出错的事就一定会出错。常见问题如下。

问题1：如果model里定义了一个函数，如初始化函数init_hidden等，并已实现DataParallel，在train函数里该如何调用？

class Model(nn.Module):
    def __init__(self, ):
        pass

    def forward(self, ):
        pass

    def init_hidden(self, ):
        pass


model = Model()
model = nn.DataParallel(model, device_ids=devic

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AnUnverse

关注关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

pytorch 最简单的单向RNN应用

qq_40107571的博客

12-19

737

pytorch 最简单的单向RNN应用

nn.DataParallel

Zsusan7的博客

04-23

599

nn.DataParallel 是 PyTorch 中的一个模块，用于在多个 GPU 上并行运行模型。当有多个 GPU 并且想要利用它们来加速训练或推理时，这个模块会非常有用。nn.DataParallel 通过对模型中的每个子模块进行复制，并将输入数据分割成多个部分，然后在每个 GPU 上并行处理这些部分来实现并行化。

1 条评论您还未登录，请先登录后发表或查看评论

pytorch 多GPU训练总结（DataParallel的使用）

热门推荐

不忘初心不动摇

02-28

8万+

这里记录用pytorch 多GPU训练踩过的许多坑仅针对单服务器多gpu 数据并行而不是多机器分布式训练一、官方思路包装模型这是pytorch 官方的原理图按照这个官方的原理图修改应该参照 https://blog.csdn.net/qq_19598705/article/details/80396325 上文也用dataParallel 包装了optimize...

DataParallel使用

qq_37950540的博客

06-08

3482

DataParallel' object has no attribute https://github.com/yysijie/st-gcn/issues/83 self.model.extract_feature -> self.model.module.extract_feature pytorch 多GPU训练总结（DataParallel的使用） https://blog...

【pytorch】torch.nn.DataParallel用法详解

sazass的博客

05-10

5万+

参考博客： https://blog.csdn.net/baidu_35120637/article/details/110785801 https://blog.csdn.net/zhjm07054115/article/details/104799661 https://blog.csdn.net/anshiquanshu/article/details/108186955 在多卡的GPU服务器，当我们在上面跑程序的时候，当迭代次数或者epoch足够大的时候，我们通常会使用nn.DataParallel

torch.nn.DataParallel()--多个GPU加速训练

MOL

06-05

1万+

公司配备多卡的GPU服务器，当我们在上面跑程序的时候，当迭代次数或者epoch足够大的时候，我们通常会使用nn.DataParallel函数来用多个GPU来加速训练。一般我们会在代码中加入以下这句： device_ids = [0, 1] net = torch.nn.DataParallel(net, device_ids=device_ids) 似乎只要加上这一行代码，你在ternimal下执行watch -n 1 nvidia-smi后会发现确实会使用多个GPU来并行训练。但是细心点会发现其实第

使用DataParallel和DistributedDataParallel的两种多GPU分布式训练方法包含加载单GPU和多GPU保存的预训练模型权重的迁移学习

leigm

09-15

653

使用DataParallel和DistributedDataParallel的两种多GPU分布式训练方法包含加载单GPU和多GPU保存的预训练模型权重的迁移学习

基于PyTorch框架构建循环神经网络RNN对IMDB数据集实现情感二分类

最新发布

04-30

【作品名称】：基于PyTorch框架构建循环神经网络RNN对IMDB数据集实现情感二分类【适用人群】：适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 ...

Dynamic-RNN-based-PyTorch:基于pytorch的动态rnn的实现

05-11

PyTorch是一个强大的深度学习框架，它提供了灵活且高效的工具来构建和训练神经网络，包括RNN。本项目“Dynamic-RNN-based-PyTorch”是一个基于PyTorch实现的动态RNN示例，旨在帮助开发者理解和应用这种模型。在...

Balanced-DataParallel:这里是改进了pytorch的DataParallel，使用了平衡第一个GPU的显存使用量

03-21

平衡数据并行这里是改进了pytorch的DataParallel，使用了平衡第一个GPU的显存使用量本代码来自transformer-XL： : 代码不是本人写的，但是感觉很好用，就分享一下。怎么使用：这个BalancedDataParallel类使用起来和DataParallel类似，下面是一个示例代码： my_net = MyNet() my_net = BalancedDataParallel(gpu0_bsz // acc_grad, my_net, dim=0).cuda() 这里包含三个参数，第一个参数是第一个GPU要分配多大的batch_size，但是要注意，如果您使用了渐变累积，那么此处替换的是每次进行运算的实际batch_size大小。举个例子，比如你在3个GPU上面跑代码，但是一个GPU最大只能跑3条数据，但是因为0号GPU还要做一些数据的整合操作，于是0

pytorch 单机多GPU训练RNN遇到的问题

01-06

在使用DataParallel训练中遇到的一些问题。 1.模型无法识别自定义模块。如图示，会出现如AttributeError: ‘DataParallel’ object has no attribute ‘xxx’的错误。原因：在使用net = torch.nn.DataParallel(net)之后，原来的net会被封装为新的net的module属性里。解决方案：所有在net = torch.nn.DataParallel(net)后调用了不是初始化与forward的属性，需要将net替换为net.module。 2.隐藏状态不被拆分到多GPU里。这种错误常出现在RNN以及衍生

DataParallel

weixin_38530843的博客

11-25

368

详解Pytorch的nn.DataParallel_zandaoguang的博客-CSDN博客

Pytorch的nn.DataParallel详细解析

qq_38410428的博客

08-04

2万+

前言 pytorch中的GPU操作默认是异步的，当调用一个使用GPU的函数时，这些操作会在特定设备上排队但不一定在稍后执行。这就使得pytorch可以进行并行计算。但是pytorch异步计算的效果对调用者是不可见的。但平时我们用的更多其实是多GPU的并行计算，例如使用多个GPU训练同一个模型。Pytorch中的多GPU并行计算是数据级并行，相当于开了多个进程，每个进程自己独立运行，然后再整合在一起。 device_ids = [0, 1] net = torch.nn.DataParallel(net,

详解Pytorch的nn.DataParallel

zandaoguang的博客

09-01

5025

↑ 点击蓝字关注视学算法作者丨Mario@知乎来源丨https://zhuanlan.zhihu.com/p/102697821编辑丨极市平台极市导读在Pytorch中，nn.Dat...

pytorch 多卡训练--DataParallel

chuansailang4709的博客

03-15

1797

用pytorch进行多GPU训练，只需要学会把单卡训练的代码稍微改一下即可。不模型用DataParallel包装一下： device_ids = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] # 10卡机 model = torch.nn.DataParallel(model, device_ids=device_ids) # 指定要用到的设备 model = model.cuda(device=device_ids[0]) # 模型加载到设备0 数据也指定设备： X_train

DataParallel 笔记

jacke121的专栏

09-25

2640

DataParallel if arg.cuda: model=model.cuda() #这里将模型复制到gpu ,默认是cuda('0')，即转到第一个GPU 2 if len(device_id)>1: model=torch.nn.DaraParallel(model);#前提是model已经.cuda() 了在 pytorch 多GPU训练下，存储整个模型（而不是model.state_dict() ）后再调...

PyTorch多卡分布式训练DistributedDataParallel 使用方法

AI吃大瓜的博客

02-07

1万+

Pytorch多卡训练有两种方式，一种是单进程多GPU训练模式(single process multi-gpus)，另一种的多进程多卡模式(multi-processes multi-gpus)。Pytorch通过nn.DataParallel可实现多卡训练模型（简称DP模式），这是single process multi-gpus 的多卡并行机制，这种并行模式下并行的多卡都是由一个进程进行控制，其缺点有：尽管 DataLoader 可以指定 num_work