LLM课程【书生·浦语 InternLM实战营】4 - Finetune

最新推荐文章于 2024-08-08 17:44:43 发布

robin_ze

最新推荐文章于 2024-08-08 17:44:43 发布

阅读量181

点赞数 7

分类专栏： LLM 文章标签：开源 chatgpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/robin_ze/article/details/138032781

版权

LLM 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Finetune简介

为什么finetune

当前大多数大语言模型是底座foundation模型，为一般性任务进行与训练。应用于特定的下游任务，则需要领域内微调以得到更好的表现。

finetune两种范式

增量预训练微调：foundation模型学习某个垂类领域的知识
指令微调：让模型学会更精细的问答对话模板

Finetune操作

微调数据处理流程

原始数据 -> 标准格式数据（分角色） -> 对话模板（让LLM知道角色划分） -> Tokenize -> 添加label -> 进行训练

微调方案

LoRA & QLoRA，基座模型不变，在基座模型之上使用LoRA模型

Full Finetuning：加载所有模型及其优化器
LoRA：加载所有模型和LoRA部分的优化器，节省显存开销
QLoRA：用4-bit方式（低精度）加载模型，进一步节省显存开销

InternLM Finetune框架：XTuner

封装好的微调工具箱，以配置文件场景封装finetune场景；显存很低

功能亮点

适配多种生态：多种微调算法、多种开源生态
适配多种硬件
支持工具类模型的对话
提供数据格式转换

用户可以关注数据内容，不必花心思处理复杂的数据格式

操作方法

拷贝配置文件 -> 修改配置文件 -> 运行微调过程 -> 与微调后的模型对话

内置的加速方式

Flash Attention：attention计算并行化
DeepSpeed ZeRO：将训练中间状态切片

自动优化加速（开发者无需过多关注算法细节）

多模态LLM案例：电子眼

增加图像处理的Image Projector，将文本向量与图片向量同时输入LLM得到生成文本

\<question text\>\<image\> -- \<answer text\>

关注

7
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
LLM课程【书生·浦语 InternLM实战营】4 - Finetune

LLM finetune介绍，及XTuner微调框架的特点
复制链接

扫一扫

专栏目录

robin_ze CSDN认证博客专家 CSDN认证企业博客

码龄4年

11: 原创

115万+: 周排名

13万+: 总排名

5832: 访问

: 等级

151: 积分

27: 粉丝

38: 获赞

9: 评论

33: 收藏

私信

关注

热门文章

分类专栏

LLM 9篇
pytorch 1篇

最新评论

LLM实战【书生·浦语 InternLM实战营】5 - LMDeploy模型部署过程
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
LLM实战【书生·浦语 InternLM实战营】5 - LMDeploy模型部署过程
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
LLM实战【书生·浦语 InternLM实战营】4 - 复现finetune过程
CSDN-Ada助手: 恭喜您成功写下第9篇博客！看到您不断分享LLM实战经验，真是令人佩服。接下来，希望您可以继续坚持创作，不断挑战自我，分享更多有关finetune过程的经验和技巧，让更多人受益。期待您的下一篇作品！祝您创作愉快！
LLM实战【书生·浦语 InternLM实战营】5 - LMDeploy模型部署过程
CSDN-Ada助手: 恭喜您写下了第10篇博客！看到您分享关于LLM实战的内容，让我感到十分兴奋。希望您能继续坚持不懈地创作，为读者带来更多有价值的内容。在下一篇博客中，或许可以分享一些关于模型优化或者性能提升的经验，让我们一起学习进步吧！期待您的下一篇作品。
LLM实战【书生·浦语 InternLM实战营】6 - Lagent与AgentLego
CSDN-Ada助手: 恭喜您写完了第11篇博客！看到您在LLM实战的实践经验分享，让我受益匪浅。希望您能继续坚持创作，分享更多关于Lagent与AgentLego的心得体会。同时，建议您可以尝试深入探讨它们在实际项目中的应用场景，或者结合其他相关主题展开讨论，让读者能够更全面地了解这些内容。期待您的下一篇作品！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。