数据并行与模型并行

最新推荐文章于 2024-07-07 16:25:33 发布

wujianming_110117

最新推荐文章于 2024-07-07 16:25:33 发布

阅读量1.1k

点赞数 1

分类专栏：工具链与软件库 GPGPU&CUDA&FPGA&ASIC&SOC 算子优化&图优化&量化

吴建明

本文链接：https://blog.csdn.net/wujianing_110117/article/details/117917367

版权

本文探讨如何利用分布式计算加速深度学习模型的训练，通过数据并行与模型并行策略提高效率。数据并行将大批次划分为小批次，各节点独立计算后汇总梯度；模型并行则是将大型模型的不同部分分配到不同节点。通过这种方式，能够在多个GPU上分散计算任务，提高训练速度。

摘要由CSDN通过智能技术生成

数据并行与模型并行
为了加快模型的训练，可以使用分布式计算的思路，把这个大批次分割为很多小批次，使用多个节点进行计算，在每个节点上计算一个小批次，对若干个节点的梯度进行汇总后再加权平均，最终求和就得到了最终的大批次的梯度结果。
在这里插入图片描述

在上面这个公式中：w是模型的参数；在这里插入图片描述
是采用batch_size = n计算得到的真实梯度。这个公式想要证明的是，可以在不同的节点上分别对n的一部分进行梯度的计算，将各个GPU的梯度进行汇总后的加权平均值。公式中最后一行中，在第k个节点有
个数据，在这里插入图片描述
是该节点上计算得到梯度。
，n个样本数据被分拆到了多个节点上。
其中，

最低0.47元/天解锁文章

wujianming_110117

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。