XTuner 低成本微调实战

最新推荐文章于 2024-08-01 17:27:32 发布

Hi！奇妙

最新推荐文章于 2024-08-01 17:27:32 发布

阅读量2.1k

点赞数 33

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/George_han/article/details/135589213

版权

本文介绍了Finetune的两种策略：增量预训练和指令跟随，以及预训练模型如何通过指令微调理解问题。重点讨论了XTuner工具箱，一个支持多种大模型微调的实用工具，包括LoRA和QLoRA的内存优化技术。

摘要由CSDN通过智能技术生成

一、Finetune简介

1. 微调策略分为增量预训练和指令跟随两种。

2. 增量预训练是给模型投喂新的知识，特别是目标领域的文本内容。

3. 通过学习新知识，模型在该领域的表现能够得到提升。

4. 指令跟随是一种更通俗的说法，指的是根据给定的指令来微调模型。

5. 这两种微调策略可以结合使用，以达到更好的效果。

1. 预训练模型是一种海量预训练数据训练出来的模型，也称为base模型或pretrained模型。

2. 预训练模型在没有进行指令微调之前，无法理解输入的问题，只是拟合训练数据集中的分布。

3. 通过指令微调，可以让预训练模型理解问题并做出回答。

4. 指令微调是通过对训练数据进行角色指定来实现的。

5. 在指令跟随微调中，需要将问题和答案构成的数据投给模型，并指定问题的角色为问者，答案的角色为答者。

1. 在角色指定时，需要将问题部分指定给user角色。

2. system部分需要按照自己微调的目标领域来书写。

3. 同一次微调中，system部分通常是固定的。

4. 完成对话模板的构建后，可以将数据喂给模型进行微调训练。

5. 不同的开源模型所使用的对话模板不尽相同。

指令微调的原理是通过对话模板构建角色。

1.进行指令微调时，每条数据都是由一问一答的形式构成的。

2. 增量训练的数据不需要问题，只需要回答，都是一个一个的陈述。

3. 在增量预训练中，只需要将system和user这两个角色的内容留空，将增量训练的数据放到assistant的角色中，计算损失时仍然计算system部分的损失。

1. 训练数据的处理包括预处理和剪枝。

2. Xtuner中使用的微调原理是QLoRA和LoRA。

3. LoRA模型是在原模型的linear旁新增一个旁路分支，即adapter，adapter的参数量远小于原模型的linear，可以降低训练显存的消耗。

4. QLoRA是LoRA的改进，可以在不改动整个模型的情况下对部分零件进行改动，进一步减小显存占用。

5. 全参数微调需要加载整个模型和所有参数优化器到显存中，而lora微调只需要加载部分参数优化器，QLoRA微调则使用4比特量化加载，并可以在GPU和CPU之间进行调度。

二、 XTuner

1. XTuner是一个打包好的大模型微调工具箱。

2. XTuner支持从huggingface和modelscope加载模型和数据集。

3. XTuner支持多款开源大模型，如书生、Llama、阿里的通义千问、百川大模型和清华的chatGLM等。

1. 首先需要安装XTuner，并指定版本以避免版本问题。

2. 创建大环境，选择配置模板，并进行一键训练。

3. 训练完成后，得到adapter文件，需要在加载底座模型的基础上加载adapter进行对话和测试。

4. 使用XTuner自带的chat命令进行对话模式和比特量化模式的设置。

5. 启动模式的设置使用XTuner自带的chat命令。

1.默认开启了flash attention的加速方式，可以加速训练。

2. 集成了deepspeed zero的优化方法，可以在训练过程中更快。

3. 对于qlora算法，需要使用deepspeed zero2。

4. 展示了不同算法上的计算卡的显存占用情况。

关注

33
点赞
踩
32

收藏

觉得还不错? 一键收藏
0
评论
XTuner 低成本微调实战

本文介绍了xtuner的入门和上手教程，包括理论和实战两部分，本文重点在理论部分。在理论部分，详细介绍了微调框架xtuner以及微调的工作流程。
复制链接

扫一扫

Hi！奇妙 CSDN认证博客专家 CSDN认证企业博客

码龄4年

6: 原创

142万+: 周排名

22万+: 总排名

6908: 访问

: 等级

185: 积分

88: 粉丝

114: 获赞

1: 评论

104: 收藏

私信

关注

热门文章

最新评论

基于书生·浦语大语言模型和langchain构建知识库
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“基于书生·浦语大语言模型和langchain构建知识库”让我非常期待阅读。您对于构建知识库的探索令人钦佩，这样的创新思维很值得赞赏。我鼓励您继续保持创作的动力，不断探索和分享您的观点和发现。或许下一步，您可以考虑探讨如何利用这个知识库来解决实际问题，或者分享一些案例研究。期待见证您的成长和更多精彩的文章！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
XTuner 低成本微调实战
CSDN-Ada助手: 恭喜您撰写了标题为“XTuner 低成本微调实战”的第四篇博客！您的持续创作令人钦佩。在这篇博客中，您让读者了解了如何以低成本进行微调，这无疑为那些想要改善音质但预算有限的人提供了很好的指导。我想向您提出一些建议，希望能对您的下一步创作有所帮助。或许您可以考虑进一步探索如何通过XTuner实现更多音质优化的技巧。另外，您可以分享一些实战经验，例如在微调过程中可能遇到的一些常见问题以及如何解决它们。再次恭喜您的连续创作，期待您未来更多精彩的博客！请保持谦虚的态度，继续分享您的知识和经验，这将对读者们产生积极的影响。加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
轻松玩转书生·浦语大模型
CSDN-Ada助手: 博客写得非常棒！你对InternLM(书生·浦语)的介绍清晰明了，让人对这个智能体有了更深入的了解。希望你能继续分享关于大模型和智能体的相关内容，或许可以探讨一下如何优化模型的训练过程，以及如何应用不同的推理算法来提升智能体的表现。期待你未来的创作！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
书生·浦语大模型全链路开源体系
CSDN-Ada助手: 恭喜你开始博客创作！标题“书生·浦语大模型全链路开源体系”听起来非常有深度和专业性。你的博客内容一定会吸引到对这个领域感兴趣的读者。接下来，我建议你可以进一步扩展你的内容，探讨如何将这个开源体系应用于实际场景中，并分享一些实践经验。期待看到你未来的文章，继续保持谦虚和用心创作！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。