李白:你的模型权重很不错,可惜被我没收了

LiBai是一个主打分布式训练的模型库,其特点是分布式代码简单易用,与单机代码相似。它支持PyTorch、HuggingFace模型权重,并能进行多机多卡分布式推理。LiBai提供了灵活的配置系统和一键转换ONNX功能,与Megatron相比,具有类似的吞吐量。此外,LiBai还允许用户加载和转换PyTorch、HuggingFace模型,实现跨框架推理。
摘要由CSDN通过智能技术生成

82a3533c37475b2bd9324e9cfd53dfbe.png

撰文|CPFLAME

大噶好,年更楼主今天想推的是,主打分布式训练的模型库_李白(LiBai)。 

https://github.com/Oneflow-Inc/libaihttps://github.com/Oneflow-Inc/libai

对于目前市面上的模型库来说,选择实在是太多了,换了一批又一批,眼睛都挑花了,为什么要用LiBai?(如果你觉得LiBai万一某天能用到,或者这篇文章读下来感觉比较开心,可以去GitHub上点赞,如果能三连就更好了。众所周知,GitHub点赞其实是个收藏夹功能)。

按照现在的趋势来说,模型越来越大了,大到一张GPU甚至装不下完整的模型,必须得上分布式并行技术,但是分布式代码在很多框架下都是高度定制化的,对于新手来说根本读不懂,也不知道应该怎么使用,导致大家上手非常的困难,让自己珍贵的发际线显得更加珍贵。

针对大模型上述存在的痛点,导致我们必须上分布式(数据并行、模型并行、流水并行)才能跑起来一个大模型。

那么,LiBai有哪些特点呢?你坐好,我要发功了。

需要详细分章介绍的优势(看上去还不错,用户也可以听得懂,也知道要干什么):

  • 简单易用的分布式代码,单机代码和分布式代码基本一致

  • 可以无缝使用PyTorch、HuggingFace的model权重,并且还可以在LiBai下进行多机多卡的分布式推理

  • 开箱即用,所有的分布式并行配置(Grad Acc,AMP,Checkpointing,ZeRO,Auto Parallel)技术都只需要在config里面一键设置就可以生效,不需要在算法代码model.py中额外添加

  • 支持模型一键转换 ONNX


我搁这儿就要介绍完的优势(看上去大家也有,很虚的帽子话),为了不让大家觉得过于虚,在介绍的同时也会插入相关的例子。 

1. 具有高度灵活性和高效率,同时支持动态图eager模式和静态图graph模式,支持一键切换,在方便debug和高效性之间反复横跳。

87ec68506c8158a008c18144d1cc87ae.png

2. 对于分布式并行的支持比较全面,大家可以在里面尽情地组合各种分布式并行的组件。

f5b448475a9407eba384e7d11943cace.png

3. LiBai下面有内置的layers直接使用,避免重复造轮子,比如用LiBai下面的Linear层就可以快速地构建一个2D并行(数据并行+模型并行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值