自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

cjdwd的博客

DeepLearning

关注

文章平均质量分 51

关注数：文章数：1 文章阅读量：1979 文章收藏量：0

作者: cjdwd

这个作者很懒，什么都没留下…

展开

Pytorch使用DistributedDataParallel（DDP）多机多卡训练详解

DDP使用多进程训练，在进程运行中，他们的梯度是同步的，每次iteration后梯度会逐个传播，然后一同下降，这样每次iteration后它们的梯度都是一样的，如上图process 0传梯度到process 1，process 1又传回梯度到process 0。在多机多卡训练中使用DDP，我们需要为每张卡创建一个进程，例如两台机（pc1、pc2），每台四卡，我们需要创建8个进程，以下均使用此例子，设pc1的gpu编号为0–3，pc2的为4–7，即他们的global node rank为0–7，它们的lo.

原创 2021-04-26 11:47:41 · 1979 阅读 · 0 评论