书生大模型: XTune微调

最新推荐文章于 2024-09-15 17:22:56 发布

Young@2020

最新推荐文章于 2024-09-15 17:22:56 发布

阅读量358

点赞数 3

文章标签：人工智能

本文链接：https://blog.csdn.net/m0_47652448/article/details/142052359

版权

环境安装：我们想要用简单易上手的微调工具包 XTuner 来对模型进行微调的话，第一步是安装 XTuner ！安装基础的工具是一切的前提，只有安装了 XTuner 我们才能够去执行后续的操作。
前期准备：在完成 XTuner 的安装后，我们下一步就需要去明确我们自己的微调目标了。我们想要利用微调做一些什么事情呢，然后为了实现这个目标，我们需要准备相关的硬件资源和数据。
启动微调：在确定了自己的微调目标后，我们就可以在 XTuner 的配置库中找到合适的配置文件并进行对应的修改。修改完成后即可一键启动训练！训练好的模型也可以仅仅通过在终端输入一行命令来完成转换和部署工作！

按照流程走完之后，执行代码：

conda activate xtuner0121

streamlit run /root/InternLM/Tutorial/tools/xtuner_streamlit_demo.py

运行后，在访问前，我们还需要做的就是将端口映射到本地。用ssh。
在这里插入图片描述

微调的时候需要准备数据和配置文件
准备好了所有内容，只需要将使用 xtuner train 命令令即可开始训练。
模型转换：本质其实就是将原本使用 Pytorch 训练出来的模型权重文件转换为目前通用的 HuggingFace 格式文件,可以使用 xtuner convert pth_to_hf 命令来进行模型格式转换。
模型合并：对于 LoRA 或者 QLoRA 微调出来的模型其实并不是一个完整的模型，而是一个额外的层（Adapter），训练完的这个层最终还是要与原模型进行合并才能被正常的使用。在 XTuner 中提供了一键合并的命令 xtuner convert merge，在使用前需要准备好三个路径，包括原模型的路径、训练好的 Adapter 层的（模型格式转换后的）路径以及最终保存的路径。
微调完成后，可以再次运行xtuner_streamlit_demo.py脚本来观察微调后的对话效果，不过在运行之前，需要将脚本中的模型路径修改为微调后的模型的路径。