探索BLOOM-LoRA：低秩适应的多用途大模型

最新推荐文章于 2024-09-23 13:23:12 发布

孔岱怀

最新推荐文章于 2024-09-23 13:23:12 发布

阅读量855

点赞数 20

本文链接：https://blog.csdn.net/gitblog_00033/article/details/139385393

版权

探索BLOOM-LoRA：低秩适应的多用途大模型

BLOOM-LORADue to restriction of LLaMA, we try to reimplement BLOOM-LoRA (much less restricted BLOOM license here https://huggingface.co/spaces/bigscience/license) using Alpaca-LoRA and Alpaca_data_cleaned.json项目地址:https://gitcode.com/gh_mirrors/bl/BLOOM-LORA

项目简介

BLOOM-LoRA是针对BLOOM模型的一种低秩适应方法，旨在在各种Instruct-Tuning数据集上优化和微调这个大型预训练语言模型。该项目的创建主要因为LLaMA模型的许可限制，而BLOOM模型的许可证更为宽松，并且它基于包括59种自然语言和编程语言的大规模数据集进行训练，覆盖范围更广。

项目提供了从零开始复现Stanford Alpaca结果所需的代码，并提供了在不同模型大小（如71亿参数）上的应用实例。不仅如此，该框架还支持在低成本设备（如Raspberry Pi）上运行，这对于研究者来说是一个极好的资源。

项目技术分析

BLOOM-LoRA采用了低秩权重调整（LoRA）技术，这是一种高效且节省资源的模型微调策略。通过结合Hugging Face的PEFT工具和Tim Dettmers的bitsandbytes库，BLOOM-LoRA可在单个RTX 4090 GPU或多个RTX 3090 GPU上进行训练，仅需五小时左右。此外，项目还包括一个下载、推理基础模型和LoRA权重的脚本，以及训练后的LoRA权重本身，用户可以轻松访问并部署。