训练大模型的九大深度学习库；谷歌转向文字→视频生成的两大利器｜AI系统前沿动态...

OneFlow深度学习框架

已于 2022-10-19 11:06:26 修改

阅读量5.6k

点赞数 5

分类专栏：前沿技术文章标签：分布式神经网络算法机器学习人工智能

于 2022-10-18 08:03:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/OneFlow_Official/article/details/127385341

版权

训练大型深度学习模型需要极大的内存，才能储存中间层的激活函数输出和权重等。一些模型只能在单个GPU上训练，训练时须将批大小（batch size）设置得极小；还有一些模型则太大，单个GPU放不下。这些问题会导致在某些情况下模型训练效率极低，甚至无法训练。训练大型深度学习模型主要有两大方法：数据并行、模型并行。

当单个GPU的内存可以完整容纳整个模型时，这是可实现数据并行的最简单的情况。但此时，模型训练可用的batch size就变得较小，增加了训练难度。解决办法是将不同的模型实例放在不同的GPU上运行，每个模型实例计算不同的数据批次。

每个模型实例都有相同的参数初始化，但在前向传播中，每个模型实例会收到不同的数据批次。每个模型实例产生的梯度会被集结起来，用以计算梯度更新，然后进行模型参数更新，更新后的参数将被发送到每个模型示例中。

当单个GPU无法容纳整个模型时，模型并行就十分必要。模型并行要求将模型切分到多个GPU上进行训练。模型并行是训练大模型的有效办法，但它的缺点是算力的利用率太低。因为同一时间只有一个GPU正在运行，其余GPU都将闲置。

目前，数据并行和模型并行都取得了一定的进步，可以提升训练和推理时的效率。以下是业内流行的九大深度学习库。

1. Megatron-LM

Megatron是NVIDIA应用深度学习研究团队研发的大规模Transformer语言模型训练框架，支持模型并行（张量并行、序列并行与流水并行）与多节点预训练（multi-node pre-training），目前已支持BERT、GPT和T5模型。

链接：https://github.com/NVIDIA/Megatron-LM

2. DeepSpeed

DeepSpeed是Microsoft推出的深度学习库，用于训练Megatron-Turing NLG 530B和BLOOM等大型模型，在训练、推理和压缩三方面都有所创新。

DeepSpeed具有如下优点：

可进行十亿乃至万亿级参数的稀疏/密集模型的训练/推理

最低0.47元/天解锁文章

OneFlow深度学习框架

关注

5
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
训练大模型的九大深度学习库；谷歌转向文字→视频生成的两大利器｜AI系统前沿动态...

训练大型深度学习模型需要极大的内存，才能储存中间层的激活函数输出和权重等。一些模型只能在单个GPU上训练，训练时须将批大小（batch size）设置得极小；还有一些模型则太大，单个GPU放不下。这些问题会导致在某些情况下模型训练效率极低，甚至无法训练。训练大型深度学习模型主要有两大方法：数据并行、模型并行。当单个GPU的内存可以完整容纳整个模型时，这是可实现数据并行的最简单的情况。但此时，模型训...
复制链接

扫一扫

专栏目录

OneFlow深度学习框架 CSDN认证博客专家

CSDN认证企业博客

329: 原创

1万+: 周排名

6418: 总排名

171万+: 访问

: 等级

4591: 积分

5252: 粉丝

1875: 获赞

427: 评论

2976: 收藏

私信

关注

热门文章

分类专栏

最新评论

SiliconCloud公测上线，每人免费送3亿Token
OneFlow深度学习框架: 可说呢，OpenAI的模型是最强的
SiliconCloud公测上线，每人免费送3亿Token
BossFriday: 简单试用了下文本对话，文生成图。和OpenAI对比起来差很多，不过都还是能用的。
LLaMA 3：大模型之战的新序幕
YesPMPYesPMP: 互联网众包平台Yespmp，帮助项目实现落地。平台提供全方位的服务，包括IT项目开发、运营推广、创意设计、灵活用工等多个领域。它为项目发包方和接包服务商提供了一个交流和合作的平台，帮助双方找到合适的合作伙伴，解决项目管理中的各种痛点，如项目风险高、成本和进度控制困难等。同时，平台还提供项目监理、开发工具包、虚拟课堂等支持，帮助项目从设计到开发再到运营的整个周期顺利实施。
OpenAI首席科学家：直面AGI的可能性
weixin_55183196: 支持，哪怕未来世界有AI主宰，这就是自然。
LLaMA 3：大模型之战的新序幕
weixin_55183196: 大模型自身的能力还需要提高，可以利用现有的能力赚钱购买图书版权从而不断学习。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。