浦语学习笔记第三章——XTuner 微调 LLM：1.8B、多模态、Agent

最新推荐文章于 2024-08-23 22:07:50 发布

位置隐私

最新推荐文章于 2024-08-23 22:07:50 发布

阅读量459

点赞数 4

文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_83572169/article/details/140046771

版权

微调的概念

首先为什么要微调呢？现在的大模型大多数都是“foundation”模型，是非常泛化的，它们在众多专业领域的表现是不如我们微调之后的模型的，所以微调其实就是将一个泛型化的大模型调整成为一个更适用于某个专业领域的专用大模型。

两种常用的微调范式：增量预训练和指令跟随。增量预训练微调主要是为了让一个模型学到一些新知识，如某个垂类领域的知识，训练数据通常为文章，书籍，代码等等，不需要标注。而指令跟随微调是为了让模型学会对话模板，根据人类指令进行对话，常用数据为高质量的对话和问答数据，需要标注。

看一个流程图：

微调的过程

一条数据如何成为一条用于训练模型的数据呢？首先要将原始数据转变为模型可以识别的数据，即标准格式数据，通常为一种固定格式的JSON 文件；之后把数据喂给模型时，需要创建对话模板，帮助模型区分什么是用户说的，什么是模型回答的，具体操作是增加一些分隔符。通常我们也只对output值计算loss。

接下来看一看微调方案。

LoRA方法：LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

看一下具体的内容：

多模态LLM原理

多模态LLM，就是不仅能够识别文本，而且能够识别图像。使用方案为LLAVA，输入为文本问题和图像，输出是回答文本，形成数据对，可以用单模态大语言模型训练出一个image projector。两者统称为LLAVA模型。训练过程依旧分为两个阶段：Pretrain和Finetune。简单来讲就是先用简单的问题文本和图像进行预训练，然后将预训练的大模型通过更加复杂更加具有价值的高质量文本和图像进行训练。

XTUNER微调实战

见：Tutorial/xtuner/llava/xtuner_llava.md at camp2 · InternLM/Tutorial (github.com)

书生·浦语大模型实战营之XTuner 微调个人小助手认知_xtuner 按照上次微调结果继续微调-CSDN博客

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
浦语学习笔记第三章——XTuner 微调 LLM：1.8B、多模态、Agent

首先为什么要微调呢？现在的大模型大多数都是“foundation”模型，是非常泛化的，它们在众多专业领域的表现是不如我们微调之后的模型的，所以微调其实就是将一个泛型化的大模型调整成为一个更适用于某个专业领域的专用大模型。两种常用的微调范式：增量预训练和指令跟随。增量预训练微调主要是为了让一个模型学到一些新知识，如某个垂类领域的知识，训练数据通常为文章，书籍，代码等等，不需要标注。而指令跟随微调是为了让模型学会对话模板，根据人类指令进行对话，常用数据为高质量的对话和问答数据，需要标注。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。