手把手推导Ring All-reduce的数学性质

OneFlow深度学习框架

已于 2022-04-28 19:19:41 修改

阅读量3.1k

点赞数 4

分类专栏：业界观点文章标签：算法 python 人工智能大数据深度学习

于 2022-04-25 08:03:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/OneFlow_Official/article/details/124418567

版权

撰文｜袁进辉

分布式深度学习里的通信严重依赖于规则的集群通信（见《对抗软件系统复杂性③：恰当分层，不多不少》对通信的讨论），诸如 all-reduce, reduce-scatter, all-gather 等，因此，实现高度优化的集群通信，以及根据任务特点和通信拓扑选择合适的集群通信算法至关重要。

本文以数据并行经常使用的 all-reduce 为例来展示集群通信操作的数学性质。

1

all-reduce 在干什么？

图 1：all-reduce

如图 1 所示，一共 4 个设备，每个设备上有一个矩阵（为简单起见，我们特意让每一行就一个元素），all-reduce 操作的目的是，让每个设备上的矩阵里的每一个位置的数值都是所有设备上对应位置的数值之和。

图 2：使用 reduce-scatter 和 all-gather 实现 all-reduce

如图 2 所示， all-reduce 可以通过 reduce-scatter 和 all-gather 这两个更基本的集群通信操作来实现。基于 ring 状通信可以高效的实现 reduce-scatter 和 all-gather，下面我们分别用示意图展示其过程。

2

reduce-scatter 的实现和性质

图 3：通过环状通信实现 reduce-scatter

从图 2 可以看出，reduce-scatter 的结果是每个设备保存一部分 reduce 之后的结果。为了方便讨论，我们先定义一些符号。

假设有p 个设备（上面的例子中 p=4）；假设整个矩阵大小是V, 那么 reduce-scatter 后，每个设备上有

最低0.47元/天解锁文章

OneFlow深度学习框架

关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
手把手推导Ring All-reduce的数学性质

实现高度优化的集群通信，以及根据任务特点和通信拓扑选择合适的集群通信算法至关重要。
复制链接

扫一扫

专栏目录

OneFlow深度学习框架 CSDN认证博客专家

CSDN认证企业博客

340: 原创

8071: 周排名

6239: 总排名

176万+: 访问

: 等级

4784: 积分

5360: 粉丝

2027: 获赞

430: 评论

3178: 收藏

私信

关注

热门文章

分类专栏

最新评论

OpenAI首席科学家：通向无监督学习之路
K_Code_King: 主要是知识储备，他很多话背后都隐藏着很多深度的思考和知识，不具备足够的知识储备，根本理解不了
SiliconCloud公测上线，每人免费送3亿Token
OneFlow深度学习框架: 可说呢，OpenAI的模型是最强的
SiliconCloud公测上线，每人免费送3亿Token
BossFriday: 简单试用了下文本对话，文生成图。和OpenAI对比起来差很多，不过都还是能用的。
LLaMA 3：大模型之战的新序幕
YesPMPYesPMP: 互联网众包平台Yespmp，帮助项目实现落地。平台提供全方位的服务，包括IT项目开发、运营推广、创意设计、灵活用工等多个领域。它为项目发包方和接包服务商提供了一个交流和合作的平台，帮助双方找到合适的合作伙伴，解决项目管理中的各种痛点，如项目风险高、成本和进度控制困难等。同时，平台还提供项目监理、开发工具包、虚拟课堂等支持，帮助项目从设计到开发再到运营的整个周期顺利实施。
OpenAI首席科学家：直面AGI的可能性
weixin_55183196: 支持，哪怕未来世界有AI主宰，这就是自然。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。