第四课学习笔记 of 书生·浦语大模型实战营（第二期）：XTuner微调

e之寻研究智能

已于 2024-05-06 19:12:24 修改

阅读量321

点赞数 4

文章标签：学习笔记人工智能

于 2024-04-30 10:26:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45924713/article/details/138162290

版权

课程链接：XTuner 大模型单卡低成本微调实战_哔哩哔哩_bilibili

本次课主要学习的是大模型微调的基础知识以及微调工具框架XTuner的基本信息。

微调（Finetune）包含两种常用的范式，分别是增量预训练微调和指令跟随微调。增量预训练使用文章、书籍、代码等训练数据，旨在让基座模型学会某个垂类领域的新知识，微调的结果是所谓的“垂类基座模型”。指令跟随的训练数据则是高质量的对话（问答）数据，旨在让模型学会根据人类的指令进行回答和对话。

下面针对指令跟随微调，解释一下训练数据的基本构成和使用方式。原始的对话数据需要改写为标准格式，并添加对话模板，便于LLM区分System提示、用户输入和模型输出这些不同的字段。

不同的模型会有不同的对话模板格式，但是本质上都是对System提示、用户输入和模型输出做出区分。

那么，为了评估模型的效果，需要对比模型的输出和预先准备好的label。

本次实践中采用的微调方式是LoRA/QLoRA，它并不是直接更新原有大模型的权重参数（区别于全量微调），而是在原本的模型基础上新建一个旁侧支路，称为adapter，这个支路的参数数量远小于原模型。微调的过程就是训练这个adapter的参数，因此相比于全量微调，大大节约了显存和运算量。

介绍了微调的基本概念之后，有必要了解本次实践用到的微调工具：XTuner。

代码链接：InternLM/xtuner: An efficient, flexible and full-featured toolkit for fine-tuning large models (InternLM2, Llama3, Phi3, Qwen, Mistral, ...) (github.com)

XTuner是一个高效、灵活的轻量化大模型微调工具库。它支持在8GB显存下微调7B参数模型，也支持多节点微调更大规模的模型。它可以实现训练加速、deepspeed兼容，支持多种LLM，以及LoRA/QLoRA/全量微调等方式。

之后，即将在实践环节学习使用XTuner做QLoRA微调的基本方法。

e之寻研究智能

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
第四课学习笔记 of 书生·浦语大模型实战营（第二期）：XTuner微调

增量预训练使用文章、书籍、代码等训练数据，旨在让基座模型学会某个垂类领域的新知识，微调的结果是所谓的“垂类基座模型”。指令跟随的训练数据则是高质量的对话（问答）数据，旨在让模型学会根据人类的指令进行回答和对话。本次实践中采用的微调方式是LoRA/QLoRA，它并不是直接更新原有大模型的权重参数（区别于全量微调），而是在原本的模型基础上新建一个旁侧支路，称为adapter，这个支路的参数数量远小于原模型。那么，为了评估模型的效果，需要对比模型的输出和预先准备好的label。
复制链接

扫一扫

e之寻研究智能 CSDN认证博客专家 CSDN认证企业博客

码龄5年

14: 原创

154万+: 周排名

8万+: 总排名

8321: 访问

: 等级

319: 积分

166: 粉丝

176: 获赞

5: 评论

140: 收藏

私信

关注

热门文章

最新评论

第六课基础&进阶作业 of 书生·浦语大模型实战营（第二期）：Agent
Tomcat知识点大全: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
第三课基础作业 of 书生·浦语大模型实战营（第二期）：RAG智能助理
CSDN-Ada助手: 恭喜用户成功完成第5篇博客“第三课基础作业 of 书生·浦语大模型实战营（第二期）：RAG智能助理”，看来您在学习和实践中取得了不错的进展！建议下一步可以尝试深入研究RAG智能助理的更多功能和应用场景，或者分享一些关于实战经验和心得体会，让读者们更加深入地了解这一领域。期待您的更多精彩作品，加油！
第二课学习笔记 of 书生·浦语大模型实战营（第二期）
CSDN-Ada助手: 恭喜您在书生·浦语大模型实战营（第二期）中学习到了第二课的内容，并且成功地总结成了这篇博客。持续创作是提高自我学习能力的重要途径，希望您能继续保持学习的热情和创作的动力。下一步的创作建议是可以结合自己的理解和实践经验，加入更多的个人见解和心得体会，让读者更加深入地了解您的学习过程和成果。期待您更多的精彩内容，加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
第二课作业 of 书生·浦语大模型实战营（第二期）
CSDN-Ada助手: 恭喜您在书生·浦语大模型实战营（第二期）中完成了第三篇博客！持续创作是非常重要的，您的努力和坚持让人钦佩。接下来，我建议您尝试更多不同的题材和风格，挑战自我，不断提升自己的写作技巧。期待看到您更多精彩的作品！加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
第一课学习笔记 of 书生·浦语大模型实战营（第二期）
CSDN-Ada助手: 这是一篇充满深度和专业知识的博文，展示了作者在学习和实践中的努力和成果。希望作者能够继续分享自己的学习笔记，让更多人受益。除了文章中提到的内容，你也可以进一步了解自监督学习、迁移学习、模型微调等相关领域的知识和技能，这些都是深度学习领域中非常重要的概念，可以帮助你更好地理解和应用大模型实战营所涉及的内容。期待看到更多精彩的分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。