1F1B（One-Forward-One-Backward）非交错式调度模式的三个阶段

从零开始学习人工智能

于 2025-01-12 15:38:10 发布

阅读量387

点赞数 3

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41544125/article/details/145093749

版权

我来详细解释一下1F1B（One-Forward-One-Backward）非交错式调度模式的三个阶段，以帮助你更好地理解这个概念。
1F1B 非交错式调度模式
1F1B（One-Forward-One-Backward）非交错式调度模式是一种用于流水线并行训练的策略，主要用于分布式训练中的模型并行。它主要分为三个阶段：热身阶段、前向-后向阶段和后向阶段。下面详细解释每个阶段：

热身阶段（Warm-up Phase）
在这个阶段，计算设备进行不同数量的前向计算。每个设备依次执行前向计算，直到所有设备都完成一次前向计算。这个阶段的目的是为后续的前向-后向阶段做好准备，确保数据在设备之间正确传递。
假设我们有4个设备（设备0、设备1、设备2、设备3），每个设备负责模型的一部分层。模型被分成4个部分，每个设备负责一个部分。具体来说：
设备0：负责层1-4
设备1：负责层5-8
设备2：负责层9-12
设备3：负责层13-16
在热身阶段，每个设备依次执行前向计算，具体步骤如下：
设备0：执行前向计算，计算层1-4的输出，并将输出传递给设备1。
设备1：接收设备0的输出，执行前向计算，计算层5-8的输出，并将输出传递给设备2。
设备2：接收设备1的输出，执行前向计算，计算层9-12的输出，并将输出传递给设备3。
设备3：接收设备2的输出，执行前向计算，计算层13-16的输出，得到最终的模型输出。
这个阶段的目的是确保每个设备都完成一次前向计算，并且数据在设备之间正确传递，为后续的前向-后向阶段做好准备。
前向-后向阶段（Forward-Backward Phase）
在这个阶段，计算设备按顺序执行一次前向计算，然后进行一次后向计算。每个设备在完成前向计算后，会等待前一个设备的梯度信息，然后进行后向计算。这个阶段是主要的训练阶段，设备之间通过流水线并行的方式交替进行前向和后向计算。
具体步骤如下：
设备0：执行前向计算，计算层1-4的输出，并将输出传递给设备1。
设备1：接收设备0的输出，执行前向计算，计算层5-8的输出，并将输出传递给设备2。
设备2：接收设备1的输出，执行前向计算，计算层9-12的输出，并将输出传递给设备3。
设备3：接收设备2的输出，执行前向计算，计算层13-16的输出，得到最终的模型输出，并计算损失函数的梯度。
设备3：执行后向计算，计算层13-16的梯度，并将梯度传递给设备2。
设备2：接收设备3的梯度，执行后向计算，计算层9-12的梯度，并将梯度传递给设备1。
设备1：接收设备2的梯度，执行后向计算，计算层5-8的梯度，并将梯度传递给设备0。
设备0：接收设备1的梯度，执行后向计算，计算层1-4的梯度。
这个阶段通过流水线并行的方式，每个设备依次完成前向计算和后向计算，确保数据和梯度在设备之间正确传递。
后向阶段（Backward Phase）
在这个阶段，计算设备完成最后一次后向计算。最后一个设备完成后向计算后，会将梯度信息传递给前一个设备，依次类推，直到所有设备都完成后向计算。
具体步骤如下：
设备3：执行最后一次后向计算，计算层13-16的梯度，并将梯度传递给设备2。
设备2：接收设备3的梯度，执行最后一次后向计算，计算层9-12的梯度，并将梯度传递给设备1。
设备1：接收设备2的梯度，执行最后一次后向计算，计算层5-8的梯度，并将梯度传递给设备0。
设备0：接收设备1的梯度，执行最后一次后向计算，计算层1-4的梯度。
这个阶段确保所有设备都完成后向计算，梯度信息在设备之间正确传递，完成一轮完整的训练。
总结
1F1B非交错式调度模式通过三个阶段（热身阶段、前向-后向阶段、后向阶段）来实现流水线并行训练。每个阶段都有明确的职责，确保数据和梯度在设备之间正确传递，从而提高训练效率。这种模式在节省内存方面表现更好，但需要与Gpipe策略一样的时间来完成一轮计算。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

从零开始学习人工智能 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。