第4节笔记

最新推荐文章于 2024-09-28 21:20:29 发布

Thomas Bob

最新推荐文章于 2024-09-28 21:20:29 发布

阅读量232

点赞数 10

分类专栏：书生·浦语大模型实战营（第二期）文章标签：笔记人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39489477/article/details/138202371

版权

书生·浦语大模型实战营（第二期）专栏收录该内容

13 篇文章 0 订阅

订阅专栏

文章探讨了为何需要对大语言模型进行微调，介绍了两种微调范式（增量预训练和指令跟随微调），并详细描述了一条数据在微调过程中的处理方式，重点讲解了xtuner中使用的LoRA和QLoRA技术。

摘要由CSDN通过智能技术生成

XTuner微调LLM：1.8B、多模态、Agent笔记

文章目录

XTuner微调LLM：1.8B、多模态、Agent笔记

为什么要微调

很多大语言模型基本是为了普遍性的任务去做预训练的，叫做底座模型或者foundation模型；如果想利用它来完成特定的下游任务的话，就需要进行领域内的微调

微调的两种范式

增量预训练微调
- 使用场景：让底座模型学习新知识，例如某个垂直领域的常识
- 训练数据：文章、书籍、代码等
指令跟随微调
- 使用场景：让模型学会对话模板，根据人类指令进行对话
- 训练数据：高质量对话、问答数据

一条数据的一生

标准格式数据给问题和回答添加角色；下图可以看到数据的存储格式（xtuner）
- system 模型的前置条件
- user 问题部分
- assistant 回答部分
添加对话模板是为了让LLM区分出System、User、Assitant；且不用的模型有不同的模板

除了添加System、User等，还需要对数据添加起始符和结束符，大部分模型都是使用~~作为起始符，~~作为结束符；并且计算loss

不同的增量预训练微调，数据中会有input和output，所以只需要对output部分计算loss

微调方案

xtuner中主要使用LoRA和QLoRA（更低的显存消耗）

可以看下图所做的操作算是旁路分支，增加了两层Linear（可以参考残差加，突然和llama2串起来了），称为adapter
全参数微调、 LoRA 、QLoRA区别

全参数微调加载模型和参数优化器
LoRA 加载模型和adapter的优化器
QLoRA 加载4bit量化后的模型和adapter的优化器

关注

10
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Thomas Bob CSDN认证博客专家 CSDN认证企业博客

码龄7年

17: 原创

146万+: 周排名

13万+: 总排名

1万+: 访问

: 等级

360: 积分

143: 粉丝

192: 获赞

11: 评论

162: 收藏

私信

关注

热门文章

分类专栏

最新评论

第6节笔记
CSDN-Ada助手: 恭喜您撰写第10篇博客！持续创作是提升自己的最好方法，希望您能够保持这样的热情和动力。对于下一步的创作建议，我建议您可以尝试拓展一下主题的深度或者尝试一些新的写作风格，让读者有更多的新鲜感和启发。期待看到您更多精彩的作品，加油！
第6节作业
CSDN-Ada助手: 恭喜你完成了第11篇博客“第6节作业”，持续创作是一个不断进步的过程，你的坚持和努力让人钦佩。接下来，我建议你可以尝试挑战一些新领域或主题，拓宽自己的创作思路，让读者能够看到更多不同的内容。希望你能继续保持创作的热情，不断进步，期待你的更多精彩作品！
第7节作业
CSDN-Ada助手: 恭喜您完成了第12篇博客，“第7节作业”，真是辛苦了！不断坚持创作，让我们能够分享到您的心得体会，真是令人鼓舞。接下来，或许您可以尝试探索更多不同的主题，让读者能够从不同的角度了解您的见解和思考。期待您的下一篇作品，继续为我们带来新的启发和思考！祝您创作愉快！
第7节笔记
CSDN-Ada助手: 恭喜您发布了第13篇博客，“第7节笔记”！持续创作真的需要坚持和毅力，您的努力和热情让人钦佩。接下来，我建议您可以尝试探索一些新的主题或者深入挖掘某个领域，让您的博客内容更加丰富和有深度。期待看到您更多精彩的文章，加油！
第4节笔记
CSDN-Ada助手: 恭喜您发布了第14篇博客！坚持创作是一件不容易的事情，您的努力和坚持可嘉。希望您在接下来的创作中能够继续保持热情和耐心，不断提升自己的写作技巧和观点深度。或许可以考虑拓展一些新的主题或者加入一些个人见解，让读者更加感受到您的独特魅力。期待您更多精彩的作品！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。