XTuner 大模型单卡低成本微调实战

最新推荐文章于 2024-08-31 08:02:30 发布

江湖路远不包邮

最新推荐文章于 2024-08-31 08:02:30 发布

阅读量435

点赞数 7

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55546799/article/details/135558024

版权

一、Finetune简介

LLM的下游应用中，增量预训练和指令跟随是经常会用到两种的微调模式

增量预训练微调

使用场景：让基座模型学习到一些新知识，如某个垂类领域的常识

训练数据：文章、书籍、代码等

指令跟随微调

使用场景：让模型学会对话模板，根据人类指令进行对话

训练数据：高质量的对话、问答数据

指令跟随微调是未来得到能够实际对话的LLM

在实际对话时，通常会有三种角色

System 给定一些上下文信息

User实际用户，会提出一些问题

Assistant根据User的输入，结合System的上下文，做出回答

对话模板

对话模板是未来能够让LLM区分出，System,User和Assistant不同的模型会有不同的模板

LoRA&QLoRA

LLM的参数量主要集中在模型中的Linear,训练这些参数会耗费大量的显存

LoRA同过在原本的Linear旁，新增一个支路，包含两个连续的小Linear,新增的这个之路通常叫做Adapter

Adapter参数量远小于原本的Linear，能大幅降低训练的显存消耗

二、XTuner介绍

以配置文件的形式封装了大部分微调场景，0基础的非专业人员也能一键开始微调。

微调所需的最小显存仅为8GB

XTuner简介

功能亮点

适配多种生态

多种微调算法
适配多种开源生态
自动优化加速

适配多种硬件

训练方案覆盖NVIDIA20系以上的所有显卡
最低只需8GB显存即可微调7B模型

XTuner数据引擎

数据处理流程

1.原始问答对-格式化问答对

2.格式化问答对-可训练语料

数据集映射函数

XTuner内置了多种热门数据集的映射函数

对话模板映射函数

XTuner内置了多种对话模块映射函数

三、8GB显卡玩转LLM

江湖路远不包邮

关注

7
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
1
评论
XTuner 大模型单卡低成本微调实战

的下游应用中，增量预训练和指令跟随是经常会用到两种的微调模式。使用场景：让基座模型学习到一些新知识，如某个垂类领域的常识。使用场景：让模型学会对话模板，根据人类指令进行对话。以配置文件的形式封装了大部分微调场景，指令跟随微调是未来得到能够实际对话的。旁，新增一个支路，包含两个连续的小。训练数据：高质量的对话、问答数据。在实际对话时，通常会有三种角色。内置了多种热门数据集的映射函数。训练这些参数会耗费大量的显存。的参数量主要集中在模型中的。，能大幅降低训练的显存消耗。不同的模型会有不同的模板。
复制链接

扫一扫

江湖路远不包邮 CSDN认证博客专家 CSDN认证企业博客

码龄4年

8: 原创

144万+: 周排名

22万+: 总排名

5228: 访问

: 等级

160: 积分

59: 粉丝

80: 获赞

6: 评论

94: 收藏

私信

关注

热门文章

分类专栏

最新评论

LMDeploy 大模型量化部署实践
CSDN-Ada助手: 恭喜您写下了第7篇博客，题为“LMDeploy 大模型量化部署实践”。您的持续创作令人钦佩，对于量化部署的实践经验分享，我深感受益匪浅。在您的博客中，我了解到了关于LMDeploy的信息，并且对大模型量化部署的实践方法有了更清晰的认识。在下一步的创作中，我建议您可以进一步探讨LMDeploy在实际应用中的优势和不足之处，并结合您的实践经验，分享一些解决问题的思路和技巧。同时，您也可以考虑加入一些案例研究或者实例分析，以帮助读者更好地理解和应用LMDeploy。再次恭喜您，期待您的下一篇博客！
XTuner 大模型单卡低成本微调实战
CSDN-Ada助手: 恭喜作者发布了新的博客，标题看起来非常吸引人！对于XTuner 大模型单卡低成本微调实战，我非常期待能够从您的经验中学习到更多知识。希望您能够继续保持创作的热情，也许在下一篇博客中可以分享一些实战中遇到的挑战以及解决方法，这样更能够帮助到更多的读者。期待您的下一篇作品！
基于 InternLM 和 LangChain 搭建知识库
CSDN-Ada助手: 恭喜你在博客上发布了新的一篇文章！很高兴看到你对基于 InternLM 和 LangChain 搭建知识库的探索和分享。希望你能继续保持创作的热情，为我们带来更多有趣的内容。下一步，或许可以考虑深入探讨如何优化知识库的构建过程，或者分享一些实际应用案例，以便更多读者能够从中受益。期待你的下一篇文章！
轻松玩转书生·浦语大模型趣味 Demo
CSDN-Ada助手: 恭喜您发布了第四篇博客！看到您轻松玩转书生·浦语大模型趣味 Demo的内容，让我对您的创作能力赞叹不已。不过，我想提醒您可以在下一篇博客中加入更多个人观点和体验分享，这样可以让读者更加深入地了解您对于这个主题的理解和见解。期待您的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
书生·浦语大模型全链路开源体系
CSDN-Ada助手: 恭喜作者在博客上持续创作，分享了关于“书生·浦语大模型全链路开源体系”的内容。这是一个非常有意义的主题，对于学习者和从业者都具有很大的参考价值。希望作者在未来的创作中，可以更加深入地探讨这一领域的知识，结合实际案例进行分析和讨论，为读者提供更多有益的信息。加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

江湖路远不包邮 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。