李白：你的模型权重很不错，可惜被我没收了

OneFlow深度学习框架

已于 2022-11-25 18:43:14 修改

阅读量7.6k

点赞数 1

分类专栏：前沿技术文章标签：深度学习 pytorch 人工智能 LiBai oneflow

于 2022-11-10 09:35:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oneflow_official/article/details/128029914

版权

LiBai是一个主打分布式训练的模型库，其特点是分布式代码简单易用，与单机代码相似。它支持PyTorch、HuggingFace模型权重，并能进行多机多卡分布式推理。LiBai提供了灵活的配置系统和一键转换ONNX功能，与Megatron相比，具有类似的吞吐量。此外，LiBai还允许用户加载和转换PyTorch、HuggingFace模型，实现跨框架推理。

摘要由CSDN通过智能技术生成

撰文｜CPFLAME

大噶好，年更楼主今天想推的是，主打分布式训练的模型库_李白（LiBai）。

https://github.com/Oneflow-Inc/libaihttps://github.com/Oneflow-Inc/libai

对于目前市面上的模型库来说，选择实在是太多了，换了一批又一批，眼睛都挑花了，为什么要用LiBai？（如果你觉得LiBai万一某天能用到，或者这篇文章读下来感觉比较开心，可以去GitHub上点赞，如果能三连就更好了。众所周知，GitHub点赞其实是个收藏夹功能）。

按照现在的趋势来说，模型越来越大了，大到一张GPU甚至装不下完整的模型，必须得上分布式并行技术，但是分布式代码在很多框架下都是高度定制化的，对于新手来说根本读不懂，也不知道应该怎么使用，导致大家上手非常的困难，让自己珍贵的发际线显得更加珍贵。

针对大模型上述存在的痛点，导致我们必须上分布式（数据并行、模型并行、流水并行）才能跑起来一个大模型。

那么，LiBai有哪些特点呢？你坐好，我要发功了。

需要详细分章介绍的优势（看上去还不错，用户也可以听得懂，也知道要干什么）：

简单易用的分布式代码，单机代码和分布式代码基本一致
可以无缝使用PyTorch、HuggingFace的model权重，并且还可以在LiBai下进行多机多卡的分布式推理
开箱即用，所有的分布式并行配置(Grad Acc，AMP，Checkpointing，ZeRO，Auto Parallel）技术都只需要在config里面一键设置就可以生效，不需要在算法代码model.py中额外添加
支持模型一键转换 ONNX

我搁这儿就要介绍完的优势（看上去大家也有，很虚的帽子话)，为了不让大家觉得过于虚，在介绍的同时也会插入相关的例子。

1. 具有高度灵活性和高效率，同时支持动态图eager模式和静态图graph模式，支持一键切换，在方便debug和高效性之间反复横跳。

2. 对于分布式并行的支持比较全面，大家可以在里面尽情地组合各种分布式并行的组件。

3. LiBai下面有内置的layers直接使用，避免重复造轮子，比如用LiBai下面的Linear层就可以快速地构建一个2D并行（数据并行+模型并行

最低0.47元/天解锁文章

OneFlow深度学习框架

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

OneFlow深度学习框架 CSDN认证博客专家

CSDN认证企业博客

350: 原创

1万+: 周排名

5688: 总排名

183万+: 访问

: 等级

5086: 积分

5500: 粉丝

2224: 获赞

432: 评论

3366: 收藏

私信

关注

热门文章

分类专栏

最新评论

AI市场的资本谜团与流向
ConnorOne: efewfewewfwefewf
比肩GPT4，没有显卡也能用Llama-3.1-405B
HRSYS: SiliconCloud推出Llama-3.1，号称媲美GPT4，亮点是8B版本免费，无需显卡也能运行，对广大开发者真是大好消息，降低了大模型的使用门槛，值得尝试。
比肩GPT4，没有显卡也能用Llama-3.1-405B
DebugDiva: Llama-3.1-405B确实厉害，参数量大，支持多语言，还能无压力处理长文本，对话自然流畅。这模型开源了，对社区贡献大，开发者们有福了。它在多项指标上超越了GPT-4和Claude 3.5 Sonnet，真是让人眼前一亮。不过，使用时得注意资源消耗，毕竟这么大个模型，运行起来硬件得跟上。
比肩GPT4，没有显卡也能用Llama-3.1-405B
DebugDiva: Llama-3.1-405B确实给人眼前一亮，SiliconCloud让大模型应用变得更亲民，开发者能直接用API，省时省力。特别是对没显卡的小伙伴，这波操作太友好了。模型性能超越GPT-4，开源社区又迎来强援，期待看到更多创新应用。
比肩GPT4，没有显卡也能用Llama-3.1-405B
HRSYS: LLama-3.1系列确实强大，8B、70B、405B参数版本覆盖了不同需求，尤其128k的上下文长度，让复杂对话和自然交互变得可能。代码生成、复杂推理和工具使用能力也很突出，没有显卡也能用，真是个大亮点。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。