书生·浦语大模型实战营Day04微调

孙小北

已于 2024-04-17 22:16:04 修改

阅读量321

点赞数 9

分类专栏：书生·浦语大模型文章标签：深度学习人工智能 AIGC

于 2024-04-16 23:20:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/scc1371815174/article/details/137844460

版权

书生·浦语大模型专栏收录该内容

17 篇文章 6 订阅

订阅专栏

本文介绍了大模型微调的不同方法，如增量预训练、指令跟随微调，重点讲解了LoRA和QLoRA技术，以及Xtuner微调的易用性和性能优化。同时探讨了多模态LLM的原理和应用，如LLaVA方案。最后提到了实战营的作业内容，包括个人助手微调和部署等。

摘要由CSDN通过智能技术生成

书生·浦语大模型实战营Day04微调

微调

为什么微调？

缺少领域知识

在这里插入图片描述

两种微调范式

增量预训练：垂直领域的常识。书籍、文章、代码等。
指令跟随微调：高质量的问答数据。对话、问答数据。

在这里插入图片描述

二者区别

在这里插入图片描述

一条数据的一生

原始数据：原始数据
标准格式数据：Json数据

在这里插入图片描述

对话模板：准备Json数据后，自动组装

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

微调方案：LoRA和QLoRA

基座模型不变，微调一个LoRA模型。减少显存
LoRA：Low-Rank Adaptation of Large Language Models

在这里插入图片描述

Full Finetuning vs LoRA vs QLoRA

在这里插入图片描述

Xtuner 微调

Xtuner微调

傻瓜化：容易上手
轻量级：8GB显存

在这里插入图片描述

多种生态、多种硬件

在这里插入图片描述

环境配置

在这里插入图片描述

模板选择

自定义训练

在这里插入图片描述

对话

在这里插入图片描述

Xtuner数据引擎

统一处理数据格式：数据预处理

在这里插入图片描述

多数据拼接：并行

在这里插入图片描述

加速方式：Flash Attention（自动开启）、DeepSpeed ZeRO

在这里插入图片描述

InternLM2 1.8B

8GB显存
InternLM2-Chat-1.8B

在这里插入图片描述

多模态LLM

多模态LLM原理

给LLM装上电子眼：多模态LLM原理简介

在这里插入图片描述

LLaVA方案

什么型号的电子眼：LLaVA方案简介
LLaVA：有点类似LoRA（文本+图像）

在这里插入图片描述

InternLM2-Chat-1.8B+LLaVA

快速上手：InternLM2-Chat-1.8B+LLaVA
预训练+高质量的有监督Funetune

在这里插入图片描述

作业

在这里插入图片描述

个人小站：https://www.xiaowangyun.com

关注

9
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

孙小北 CSDN认证博客专家 CSDN认证企业博客

码龄12年

33: 原创

21万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

628: 积分

242: 粉丝

282: 获赞

23: 评论

247: 收藏

私信

关注

热门文章

分类专栏

最新评论

MindSpore实践图神经网络之GCN
是Yu欸: 期盼博主能够光顾我的博客，给予宝贵的指导！
MindSpore实践图神经网络之GCN
普通网友: 你的博客内容深入浅出，总是让我不再感到学习的困难，每一篇博文都是我学习的宝库。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
MindSpore实践图神经网络之环境篇
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
书生·浦语大模型实战营Day02趣味Demo
孙小北: 跟着实战营学习可以申请免费资源
书生·浦语大模型实战营Day02趣味Demo
一个不懂技术的人: 请问这个internstudio 配置升级需要钱吗？只有最基础的一个是免费的是吧

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。