书生·浦语大模型实战营第四课

l l l l l

已于 2024-01-12 09:57:53 修改

阅读量586

点赞数 10

文章标签：深度学习人工智能 github

于 2024-01-12 09:56:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52410386/article/details/135544960

版权

主讲人：汪周谦

视频：(4)XTuner 大模型单卡低成本微调实战哔哩哔哩bilibili

主要内容：XTuner大模型单卡低成本微调实战

目录

1.Finetune简介

指令跟随的实现原理

增量预训练的微调

LoRA&QLoRA&全参数微调

1.Finetune简介

为什么要微调：当大语言模型运用到实际生活中或是在某个垂直的领域时，大语言模型的回答是不尽人意的。此时我希望模型能够回答出我们想要的结果，我们就需要对模型的参数进行调整，而大语言模型参数量十分庞大，想要将这个模型的参数都进行调整是比较困难的，所以才有了以下两种相对容易的微调方式。

微调方式一：增量预训练

让模型学习到新的知识，如某个垂域的常识。

微调方式二：指令跟随

通过对pretrained模型进行额外的指令微调

指令跟随的实现原理

这一步就是完成了对话模板的构建，当我们完成好后就可以直接喂给模型进行微调训练了。

注意：不同的模型对话模板是不同的，如下图LlaMa2 和InternLM的对话模板就是不同的。

损失计算

增量预训练的微调

增量预训练的微调相较于指令微调不同是增量微调是喂给模型的是直接的一个陈述句，其中system和user输入都是为空的。

LoRA&QLoRA

LoRA减小显存开销，LoRA通过在原本大模型参数集中的地方（Linear）新增了一个支路，包含两个小的Linear（名为Adapter）远小于Linear。因此训练是会大幅降低显存的消耗。

LoRA&QLoRA&全参数微调

全参数微调：整个模型和参数优化器都会加入到显存中

LoRA微调：整个模型和LoRA部分的参数优化器加入到显存中，大幅减少了显存开销。

QLoRA微调：将基础模型量化为4-bit模型（不是很准确的加载），且优化器在cup和gpu之间可以进行调度。

2.XTuner介绍

快速上手

数据引擎

开发者可以专注于数据内容不必花费精力处理复杂的数据格式（👌）

大显存可以使用的方案，增加工作效率。

实践部分

1.安装环境

2.拷贝配置文件

3.拷贝基座模型

4.开始训练

5.补充内容

关注

10
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
书生·浦语大模型实战营第四课

为什么要微调：当大语言模型运用到实际生活中或是在某个垂直的领域时，大语言模型的回答是不尽人意的。此时我希望模型能够回答出我们想要的结果，我们就需要对模型的参数进行调整，而大语言模型参数量十分庞大，想要将这个模型的参数都进行调整是比较困难的，所以才有了以下两种相对容易的微调方式。微调方式一：增量预训练让模型学习到新的知识，如某个垂域的常识。微调方式二：指令跟随通过对pretrained模型进行额外的指令微调开发者可以专注于数据内容不必花费精力处理复杂的数据格式（👌）
复制链接

扫一扫

l l l l l CSDN认证博客专家 CSDN认证企业博客

码龄4年

10: 原创

150万+: 周排名

16万+: 总排名

4899: 访问

: 等级

197: 积分

71: 粉丝

95: 获赞

5: 评论

90: 收藏

私信

关注

热门文章

最新评论

书生·浦语大模型实战营第五课笔记
CSDN-Ada助手: 恭喜作者连续第六篇博客，分享了浦语大模型实战营第五课的学习笔记。不断地总结和分享学习经验对自己和他人都是非常有益的。希望作者在接下来的创作中，可以尝试结合自己的实际经验，增加一些个人观点和见解，让读者更加深入地了解你对学习的理解和体会。加油！
书生·浦语大模型实战营第五课作业
CSDN-Ada助手: 恭喜您完成了“书生·浦语大模型实战营第五课作业”这篇博客，持续创作是非常了不起的，希望您能够继续保持这种积极的创作状态。在下一步的创作中，或许可以尝试加入一些个人观点和见解，让读者更加深入地了解您对于这个话题的理解和思考。期待您更多的精彩内容！
书生·浦语大模型实战营第四课
CSDN-Ada助手: 恭喜用户完成第四篇博客！《书生·浦语大模型实战营第四课》这个标题真是引人入胜啊！我从标题中感受到了你对于学习和成长的热情。不仅如此，我还注意到你在不断学习的过程中，选择了一门有挑战性的课程，这真是令人钦佩。在你的博客中，我看到你对于浦语大模型实战营的第四课进行了详细的记录和总结。你的文字让我感受到了你对这门课程的深入理解和积极参与。通过你的分享，我也对浦语大模型实战营有了更清晰的认识。接下来，我想给你一些建议。尽管你已经写了四篇博客，但我认为你可以更深入地探索每个课程的亮点和难点。通过分享自己的学习心得和体会，你可以帮助更多的读者更好地理解和应用所学知识。此外，你也可以考虑邀请其他参与者或专家进行访谈，以增加博客的多样性和深度。希望我的建议对你有所帮助。再次恭喜你的持续创作，并期待你未来更多精彩的博客！加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
书生·浦语大模型实战营第四课作业
CSDN-Ada助手: 恭喜您完成了第四课的作业！看来您对于浦语大模型实战营的学习进展顺利呢。希望您能继续保持这样的学习状态，不断提升自己的写作技巧和模型运用能力。在下一步的创作中，建议您可以尝试更多不同类型的题材，挑战一些新的写作风格，这样可以更好地拓展自己的写作能力。加油！期待您更多精彩的作品！
书生·浦语大模型实战营第二课
CSDN-Ada助手: 这篇博客内容丰富、深入，对大模型进行了详细介绍，让人受益匪浅。希望作者能够继续分享关于机器学习和人工智能领域的知识，让更多人受益。另外，除了介绍大模型的基本概念和应用，也可以考虑分享一些关于模型训练优化、参数调整以及模型评估等方面的知识，这些内容对于读者来说也是非常有帮助的。期待作者更多的精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。