pytorch分布式：all_gather, all_reduce

最新推荐文章于 2024-07-22 10:21:28 发布

城俊BLOG

最新推荐文章于 2024-07-22 10:21:28 发布

阅读量5.6k

点赞数

分类专栏： Pytorch 分布式／并行

Pytorch 同时被 2 个专栏收录

47 篇文章 4 订阅

订阅专栏

分布式／并行

5 篇文章 1 订阅

订阅专栏

本文介绍了PyTorch中的分布式通信函数all_gather和chunk的用法。all_gather用于将一个tensor广播到多个进程中，而chunk则用于将tensor切分成多个部分。示例中展示了如何结合这两个函数，将features.data广播并分割成world_size份，返回包含这些切片的list，这对于分布式训练和数据并行处理具有重要意义。

摘要由CSDN通过智能技术生成

all_gather: 把一个tensor广播到一个list，返回tensor list
.chunk: 把一个tensor切分成几块

# 把 features.data广播到list中的元素上，list中的内容是total_features切分成的几个块，最后返回这个list.相当于把features拷贝成了好几份        
dist.all_gather(list(total_features.chunk(self.world_size, dim=0)), features.data)