书生·浦语（四）XTuner 微调 LLM：1.8B、多模态、Agent

最新推荐文章于 2024-07-20 06:19:20 发布

奇迹学长

最新推荐文章于 2024-07-20 06:19:20 发布

阅读量867

点赞数 5

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ppyyds/article/details/137938041

版权

本文详细介绍了如何使用Xtuner进行大语言模型的微调，包括理论讲解（微调必要性、范式及适用场景）、XTuner的实战操作、多模态升级方法以及显存优化技术。重点讨论了全参数微调、LoRA和QLoRA微调方案，以及如何在8GB显存下有效利用资源。

摘要由CSDN通过智能技术生成

本次课程包括理论和实践两大部分，学习如何使用Xtuner微调大语言模型（LLM），比如1.8B参数的模型，以及为什么要微调大语言模型，微调模型的基本流程。

首先，理论部分解释了微调的必要性、两种微调范式（增量预训练和指令微调）以及它们的适用场景。实战部分手把手教大家如何使用Xtuner工具，从创建配置文件、准备数据到启动训练。我们了解到LAURA和QLAURA微调方案对于减少显存开销的重要性。课程还介绍了如何将单模态语言模型升级为多模态，通过添加图像识别功能，使得模型能理解并回应与图片相关的对话内容。最后，通过实战操作，展示了微调前后的模型在回答问题上的显著差异。

一、为什么要微调？

1. 适应特定任务或领域：虽然预训练的模型通常具有广泛的知识和理解能力，但它们可能不完全适应特定任务的需求。通过在特定的数据集上微调模型，可以使模型更好地理解和处理与特定任务或领域相关的数据。

2. 提高性能：微调可以帮助模型在特定任务上表现得更好，如通过调整模型参数以更精确地对任务特有的特征进行建模，从而提高分类准确率、生成的质量或其他性能指标。

3. 节省资源：微调一个已经训练好的模型通常只需要较少的数据和训练周期。

4. 减少数据需求：微调通常需要的数据量比全新训练模型少得多。这对于数据较少的应用场景特别有用，因为即使是小规模的数据集也可能足以通过微调达到良好的效果。

5. 转移学习：微调是一种有效的转移学习策略，允许模型将在一个任务上学到的知识应用到其他类似任务上。这种策略在多任务学习和跨领域应用中尤其重要。

1，Finetune简介

两种Finetune范式
一条数据的一生
增量预训练微调
指令跟随微调

微调方案

基座模型不变

在基座模型上微调一个LoRA模型。

Full Finetuning 全参数微调：整个模型加载到显存中。所有模型参数的优化器，也要加载到显存中。

LoRA 微调：整个模型加载到显存中，对于参数优化器，我们保留LoRA部分的参数优化器

QLoRA 微调：模型本身加载到显存中的时候，就已经使用4bit量化的方式，不那么精确的方式加载。

二、XTuner

具体操作：XTuner快速上手

工具类模型的对话

XTuner数据引擎

多数据样本拼接，增加并行性，充分利用gpu资源

三、8GB显存玩转LLM

XTuner中内置的两种加速方式：

1、Flash Attention (已自动开启，无视即可)

2、DeepSpeed ZeRO

优化前 vs 优化后：

InternLM2 1.8B 模型

五、多模态LLM

文本单模态：首先使用文本Embedding模型对用户的输入文本，转化为文本向量，将文本向量预测输出文本。

文本+图像多模态：其他部分和文本但模态一致。在输出部分增加了对图像的输入和处理。Image Projector 对输入图像进行图像向量化。文本向量、图像向量同时进行输入，预测出输出文本。从文本单模态模型微调-> 文本+图像多模态模型的过程，实际上就是训练Image Projector的过程

吗

Pretrain阶段的数据如下：

Finetune阶段的数据如下：

微调前后效果如下：

只Pretrain 未 Finetune，只会给图像打标题

经过Finetune之后

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
书生·浦语（四）XTuner 微调 LLM：1.8B、多模态、Agent

本次课程包括理论和实践两大部分，学习如何使用Xtuner微调大语言模型（LLM），比如1.8B参数的模型，以及为什么要微调大语言模型，微调模型的基本流程。：微调可以帮助模型在特定任务上表现得更好，如通过调整模型参数以更精确地对任务特有的特征进行建模，从而提高分类准确率、生成的质量或其他性能指标。文本单模态：首先使用文本Embedding模型对用户的输入文本，转化为文本向量，将文本向量预测输出文本。QLoRA 微调：模型本身加载到显存中的时候，就已经使用4bit量化的方式，不那么精确的方式加载。
复制链接

扫一扫

奇迹学长 CSDN认证博客专家 CSDN认证企业博客

码龄3年

13: 原创

141万+: 周排名

11万+: 总排名

5174: 访问

: 等级

228: 积分

66: 粉丝

86: 获赞

4: 评论

55: 收藏

私信

关注

热门文章

最新评论

书生·浦语大模型趣味（三）茴香豆-搭建RAG智能助理
CSDN-Ada助手: 恭喜用户在博客中分享了关于搭建RAG智能助理的内容，看来您对这一主题有着深入的研究和探索。持续创作是非常值得鼓励的，希望您能继续分享更多有趣的内容。或许下一步可以考虑结合实际案例或者个人经验，让读者更容易理解和接受您的观点。期待您更多精彩的作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
第三节作业茴香豆：搭建你的RAG智能助理
CSDN-Ada助手: 恭喜用户写了第五篇博客，标题为“第三节作业茴香豆：搭建你的RAG智能助理”。不断创作是一个很好的习惯，希望您能坚持下去，继续分享您的见解和经验。建议您在未来的创作中，可以尝试深入探讨茴香豆搭建RAG智能助理的过程和心得，或者分享一些实用的技巧和经验，让读者更易于理解和应用。期待您更多精彩的内容，加油！
轻松玩转书生·浦语大模型趣味（二） Demo作业
CSDN-Ada助手: 恭喜用户发布了第三篇博客，标题看起来就很有趣味呢！Demo作业内容一定也非常精彩吧！希望用户能够继续保持创作的热情和耐心，不断总结经验，提升自己的写作水平。下一步建议可以尝试结合实际案例或个人经历进行分享，或者多尝试一些新的写作风格，让读者眼前一亮。期待用户更多优质内容的发布，加油哦！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
书生·浦语大模型第二节：Demo实践
CSDN-Ada助手: 非常棒的第二篇博客！通过实际操作演示了如何构建模型和进行Demo实践，这对于学习者来说非常有帮助。希望你能继续分享更多关于模型构建和应用的经验和教程。除了Demo实践外，你可能还可以深入介绍一些关于模型优化、调参和结果评估的方法，这些内容对于提升模型性能和解决实际问题也非常重要。同时，也可以分享一些在模型部署和维护过程中常见的技巧和注意事项。期待你的更多精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
书生-浦语大模型与人工智能
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。