大模型学习之Accelerate+Deepspeed

一、Deepspeed介绍

1.介绍

每个GPU上都包含模型参数、权重、优化器状态。

零冗余优化。

    zero_stage=3,   # Enable ZeRO (Zero Redundancy Optimizer) stage 3 optimization
                    # ZeRO stages: 
                    # 0 - disabled
                    # 1 - optimizer state partitioning
                    # 2 - optimizer state + gradient partitioning
                    # 3 - optimizer state + gradient + parameter partitioning (most memory efficient)

2.成本分析

每张卡占用资源变少,但是Zero3会使总通讯量增加。

3.ZeRO其他参数

二、Accelerate+Deepspeed集成使用

1.accelerate config启动

此方法很简便。

2.Deepspeed config

Accelerate Deepspeed页面介绍使用简便一点。

3.ZeRO2使用无注意事项,ZeRO3使用时注意:

ZeRO3分割了模型,在模型保存时需要注意。

在accelerate deepspeed配置时需要额外指定:

zero3_save_16bit_model=True

文章为自学笔记,学习视频来源于:

【【手把手带你实战HuggingFace Transformers-分布式训练篇】分布式数据并行原理与应用】 https://www.bilibili.com/video/BV1wS421w7ug/?share_source=copy_web&vd_source=5af046c796e0aad697605765d634ba90

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值