【LLM大模型】模型和指令微调方法

最新推荐文章于 2024-06-03 17:03:10 发布

u013250861

最新推荐文章于 2024-06-03 17:03:10 发布

阅读量479

点赞数

分类专栏： LLM 文章标签：大模型

本文链接：https://blog.csdn.net/u013250861/article/details/131484327

版权

LLM 专栏收录该内容

108 篇文章 226 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详细探讨了大语言模型（LLM）的发展，包括ChatGLM、LLaMA、RoBERTa、Bloom和PaLM等模型。重点介绍了指令微调的不同方法，如prompt tuning、prefix tuning、LoRA和p-tuning，以及在实践中如何有效地微调模型。文章还提到了基于LLM的医学问诊模型HuaTuo、Stanford Alpaca和Chinese-LLaMA-Alpaca的案例。此外，讨论了模型微调的工程注意事项，如显存管理和模型量化技术。

摘要由CSDN通过智能技术生成

note

Hugging Face 的 PEFT是一个库（LoRA 是其支持的技术之一，除此之外还有Prefix Tuning、P-Tuning、Prompt Tuning），可以让你使用各种基于 Transformer 结构的语言模型进行高效微调。
AIpaca羊驼：让 OpenAI 的 text-davinci-003 模型以 self-instruct 方式生成 52K 指令遵循（instruction-following）样本，以此作为 Alpaca 的训练数据，最后训练的羊驼只有7B参数量。可以使用LoRA微调优化。
LLM技术思路：
- 语言模型：llama、bloom、glm等
- 指令微调数据：alpaca_data、bella_data、guanaco_data等。目前指令微调数据上，很依赖alpaca以及chatgpt的self-instruct数据。数据处理参考下图：
- 微调加速： lora（如Alpaca-Lora）等，还可以使用peft库、量化工具包bitsandbytes、deepspeed（先读torch.distributed和ColossalAI在搞）、llama.cpp量化模型。在LoRA方法提出之前，也有很多方法尝试解决大模型微调困境的方法。其中有两个主要的方向：
  - 添加adapter层。adapter就是固定原有的参数，并添加一些额外参数用于微调；
  - 由于某种形式的输入层激活。
训练优化方法：量化、3D并行、cpu卸载

了解本专栏

超级会员免费看

u013250861

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【LLM大模型】模型和指令微调方法

该项目通过医学知识图谱和GPT3.5API构建了中文医学指令数据集，并对LLaMa模型进行了指令微调得到了一个针对医学领域的智能问诊模型HuaTuo，相比于未经过医学数据指令微调的原LLaMa而言，HuaTuo模型在智能问诊层面表现出色，可生成一些更为可靠的医学知识回答。HuggingFace 开源的一个高效微调大模型的 PEFT 库（Parameter-Efficient Fine-Tuning），目前包含LoRA，Prefix Tuning，Prompt Tuning，P-Tuning 四种算法。
复制链接

扫一扫

专栏目录