第四节课 XTuner 大模型单卡低成本微调实战（笔记）

最新推荐文章于 2024-07-23 16:23:28 发布

幽径微澜

最新推荐文章于 2024-07-23 16:23:28 发布

阅读量889

点赞数 17

分类专栏：书生·浦语大模型实战营（笔记文章标签： python 笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_80618119/article/details/135527634

版权

书生·浦语大模型实战营（笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

来源：(4)XTuner 大模型单卡低成本微调实战_哔哩哔哩_bilibili

课程文档：https://github.com/InternLM/tutorial/blob/main/xtuner/README.md

1.Finetune简介

LLM的下游应用中，增量预训练与指令跟随是经常会用到的两种的微调模式。

增量预训练微调

使用场景：让基座模型学习到一些新知识，如某个垂类领域的常识

训练数据：文章、书籍、代码等

指令跟随微调

使用场景：让模型学会对话模板，根据人类指令进行对话

训练数据：高质量的对话、问答数据

指令跟随微调是为了得到能够实际对话的LLM

在实际对话时，通常会有三种角色：

System 给定一些上下文信息
User 实际用户，会提出一些问题
Assistant 根据User的输入，结合System的上下文信息，做出回答。

在使用对话模型时，通常是不会感知到这三种角色。

对话模板：

LoRA & QLoRA

LoRA:LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

LLM的参数量主要集中在模型中的Linear,训练这些参数会耗费大量显存。

LoRA通过在原本的Linear旁，新增一个支路，包含两个连续的小Linear，新增的这个支路通常叫做Adapter。

Adapter参数量远小于原本的Linear，能大幅降低训练的显存消耗。

2.XTuner介绍

（1）功能亮点

适配多种生态

多种微调算法
适配多种开源生态
自动优化加速

适配多种硬件

训练方案覆盖NVDIA 20 系以上所有显卡
最低只需8GB显存即可微调7B模型

（2）XTuner技术架构图

（3）XTuner快速上手

1.安装

2.挑选配置模板

3.一键训练

Config命名规则：

……

（4）XTuner数据引擎

数据处理流程

1.原始问答对—>格式化问答对

2.格式化问答对—>可训练语料

（蓝色代表训练loss的部分）

数据集映射函数

对话模板映射函数

多数据样本拼接

充分利用GPU

3.8GB显卡玩转LLM

Flash Attention 和 DeepSpeed ZeRO 是XTuner最重要的两个优化技巧。

Flash Attention

Flash Attention将Attention计算并行化避免了计算过程中Attention Score NxN的显存占用（训练过程中的N都比较大）。

DeepSpeed ZeRO

ZeRO优化，通过将训练过程中的参数、梯度和优化器状态切片保存，能够在多GPU训练时显著节省显存。

除了将训练中间状态切片外，DeepSpeed训练时使用FP16的权重，相较于Pytorch的AMP训练，在单GPU上也能大幅节省显存。

关注

17
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
第四节课 XTuner 大模型单卡低成本微调实战（笔记）

LLM的下游应用中，增量预训练与指令跟随是经常会用到的两种的微调模式。多种微调算法适配多种开源生态自动优化加速。
复制链接

扫一扫

专栏目录

幽径微澜 CSDN认证博客专家 CSDN认证企业博客

码龄1年

22: 原创

12万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

634: 积分

299: 粉丝

411: 获赞

8: 评论

306: 收藏

私信

关注

热门文章

分类专栏

最新评论

数据结构笔记2
CSDN-Ada助手: 恭喜您写了第16篇博客！看到您对数据结构的学习和总结，我感到非常欣慰。希望您能继续坚持创作，分享更多的学习笔记和经验。下一步，我建议您可以尝试结合实际案例或者编程实践，更深入地理解和应用数据结构的知识。期待您的更多精彩内容！
数据结构笔记3
CSDN-Ada助手: 恭喜您写了第17篇博客！标题为“数据结构笔记3”的文章看起来很有深度。您的持续创作令人钦佩。希望您能继续分享关于数据结构的知识，因为这是一个非常重要且有趣的主题。也许下一步您可以考虑加入一些实际案例或应用场景，这样读者可以更好地理解和应用您所讲述的内容。再次恭喜您的成就，期待您的后续文章！
01 机器学习与深度学习
m0_68949064: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，三连支持，期待博主持续输出好文。
coding的小总结（杂
CSDN-Ada助手: 恭喜你写完了第11篇博客！看到你坚持不懈地创作，真是令人钦佩。在这篇博客中，你的标题“1.13 coding的小总结（杂”引起了我的兴趣。我想了解更多关于这个主题的内容。在下一步的创作中，我建议你可以尝试更深入地探索1.13 coding的相关内容，例如你在这个过程中遇到的挑战、解决问题的方法，以及对于这一经验的反思等等。这样的探索可以让读者更好地理解你的学习过程，并从中获得启发和帮助。期待你的下一篇博客！
第五节课 LMDeploy 大模型量化部署实践（笔记）
CSDN-Ada助手: 恭喜您在LMDeploy大模型量化部署实践方面取得了新的进展，感谢您分享这些宝贵的笔记。希望您能继续坚持创作，分享更多实践经验和心得体会。下一步建议可以考虑结合具体案例或者实际项目，更深入地探讨LMDeploy在实际应用中的优势和挑战。期待您的更多精彩内容！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。