pytorch学习笔记：pytorch多gpu并行训练

今天敲代码了么

于 2019-05-27 10:45:34 发布

阅读量3.4k

点赞数 1

分类专栏：学习笔记 pytorch

学习笔记同时被 2 个专栏收录

11 篇文章 2 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

PyTorch-Encoding官方文档对CGBN(cross gpu bn)实现
GPU捉襟见肘还想训练大批量模型？
- 在一个或多个 GPU 上训练大批量模型：梯度累积
- 充分利用多 GPU 机器：torch.nn.DataParallel
- 多 GPU 机器上的均衡负载： PyTorch-Encoding 的 PyTorch 包，包括两个模块：DataParallelModel 和 DataParallelCriterion
- 分布式训练：在多台机器上训练： PyTorch 的 DistributedDataParallel
Pytorch 的多 GPU 处理接口是 torch.nn.DataParallel(module, device_ids)，其中 module 参数是所要执行的模型，而 device_ids 则是指定并行的 GPU id 列表。
而其并行处理机制是，首先将模型加载到主 GPU 上，然后再将模型复制到各个指定的从 GPU 中，然后将输入数据按 batch 维度进行划分，具体来说就是每个 GPU 分配到的数据 batch 数量是总输入数据的 batch 除以指定 GPU 个数。每个 GPU 将针对各自的输入数据独立进行 forward 计算，最后将各个 GPU 的 loss 进行求和，再用反向传播更新单个 GPU 上的模型参数，再将更新后的模型参数复制到剩余指定的 GPU 中，这样就完成了一次迭代计算。所以该接口还要求输入数据的 batch 数量要不小于所指定的 GPU 数量。

使用大batch训练神经网络：单GPU，多GPU的分布式训练实践，基于PyTorch！

这里有两点需要注意：

主 GPU 默认情况下是 0 号 GPU，也可以通过 torch.cuda.set_device(id) 来手动更改默认 GPU。
提供的多 GPU 并行列表中需要包含有主 GPU

但是，DataParallel 有一个问题：GPU 使用不均衡。在一些设置下，GPU-1 会比其他 GPU 使用率高得多。

reference:

https://www.cnblogs.com/ranjiewen/p/10113532.html

今天敲代码了么

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。