XTuner 微调大模型个人小助手认知

weixin_42112760

已于 2024-08-17 01:37:27 修改

阅读量383

点赞数 4

文章标签：书生浦语 LLM

于 2024-08-16 01:00:27 首次发布

本文链接：https://blog.csdn.net/weixin_42112760/article/details/141225333

版权

XTuner微调大模型个人小助手的课程介绍了如何通过微调使大模型掌握特定领域的知识。课程分为三个部分：闯关任务、XTuner框架介绍及实战操作。XTuner支持多种硬件和算法，能够高效处理大规模模型训练。最终，学员需提交微调过程记录以获得奖励。通过本课程能够掌握微调个人小助手的技能。

亮点:
通过微调个人小助手的认知，可以使大模型掌握特定领域的专业知识，进而变成垂直领域的专家。
-闯关任务的目标是完成个人小助手的微调，使模型能识别自己是用户的助手。通过这一过程，模型的实用性和专业性会得到显著提升。
-XTuner是一个高效的微调框架，支持多种微调算法和应用场景。它还能够优化显存使用和计算加速，让开发者更专注于项目本身。
-动手实战环节将指导参与者逐步实现个人小助手的微调。通过具体操作，大家可以更深入地理解微调的过程和步骤，提高实际操作能力。
创建良好的训练环境后，需要安装xtuner并验证安装结果。安装过程包括下载源码、执行安装命令和确认版本，以确保环境适合后续的微调工作。
模型文件：
在这里插入图片描述

-在安装xtuner之后，用户可以通过帮助命令来了解更多关于xtuner的功能和使用方法。这对于不熟悉该工具的用户来说非常重要，能帮助他们更高效地使用该软件。
-在进行微调之前，需要检查微调前的对话效果。这一步骤是为了评估当前模型的性能，并为微调准备数据集提供参考。
-微调过程需要准备自己的数据集，并利用脚本生成所需的JSON文件。用户需要根据自己的需求调整脚本内容，从而确保生成的数据集符合微调的标准。
在训练模型之前，我们需要进行一些准备工作，包括修改配置文件和生成数据集。这些步骤确保模型能够正确加载自定义数据，从而进行微调以满足特定需求。
-首先，我们需要将文件中的名称改为自己的名字，并选择合适的昵称以便保存。这一步骤有助于个性化设置，方便后续操作和管理。
-在准备配置文件时，我们可以通过命令查找英特尔LM2的相关配置。选择与我们的需求最匹配的配置文件是确保模型微调成功的关键。
-修改配置文件时，需要指定模型路径和数据集路径，并确保加载自定义数据格式。通过这些修改，模型才能正确识别和处理输入数据，提升微调效果。
17:00 模型转换和合并是微调的关键步骤。通过将训练后的模型转换为哈根face格式并进行合并，能够确保我们获得一个完整且有效的模型，以便进行后续的对话验证。
-第一个步骤是将训练后的模型转换为哈根face格式，以便于后续使用。转换后的模型会保存在当前目录下的hf文件夹中，这是微调模型的基础。
-在完成模型的格式转换后，需要将原始模型与新模型进行合并。合并后的模型将保存在merge目录中，包含分词器和权重信息，确保模型的完整性。
-微调完成后，需验证模型的对话效果。通过修改模型路径并运行相关命令，可以验证微调的有效性，并确保模型能正常回答问题。

基础目标
使用 XTuner 微调 InternLM2-Chat-1.8B 实现自己的小助手认知，如下图所示（图中的伍鲜同志需替换成自己的昵称），记录复现过程并截图。
微调前：
在这里插入图片描述

进阶目标
用自己感兴趣的知识对基座模型进行增量预训练微调
在资源允许的情况下，尝试实现多卡微调与分布式微调
将自我认知的模型上传到 OpenXLab，并将应用部署到 OpenXLab

weixin_42112760

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
XTuner 微调大模型个人小助手认知

通过将训练后的模型转换为哈根face格式并进行合并，能够确保我们获得一个完整且有效的模型，以便进行后续的对话验证。使用 XTuner 微调 InternLM2-Chat-1.8B 实现自己的小助手认知，如下图所示（图中的伍鲜同志需替换成自己的昵称），记录复现过程并截图。转换后的模型会保存在当前目录下的hf文件夹中，这是微调模型的基础。-闯关任务的目标是完成个人小助手的微调，使模型能识别自己是用户的助手。-首先，我们需要将文件中的名称改为自己的名字，并选择合适的昵称以便保存。
复制链接

扫一扫