LLaMA Factory多模态微调实践：微调Qwen2-VL构建文旅大模型

机器学习是魔鬼

已于 2025-04-30 09:58:04 修改

阅读量1.4k

点赞数 15

分类专栏： AI功能岛文章标签： LLaMAFactory 矩池云 QWEN 微调

于 2025-04-18 16:38:11 首次发布

本文链接：https://blog.csdn.net/weixin_48344945/article/details/147334646

版权

AI功能岛专栏收录该内容

7 篇文章

订阅专栏

LLaMA Factory 是一款开源低代码大模型微调框架，集成了业界最广泛使用的微调技术，支持通过 Web UI 界面零代码微调大模型，目前已经成为开源社区内最受欢迎的微调框架之一，GitHub 星标超过 4.7 万。本教程将基于通义千问团队开源的新一代多模态大模型 Qwen2-VL-2B-Instruct，介绍如何使用矩池云平台及 LLaMA Factory 训练框架完成文旅领域大模型的构建。

GitHub地址：https://github.com/hiyouga/LLaMA-Factory

一、直接使用 LLaMA-Factory镜像

注：最新版 LLaMa-Factory 已经上线

选择机器：显卡型号：4090 24G显存（为保证下载速度，请选择亚太 2 区的机器）
租用实例时，请搜索关键词LLaMaFactory选择镜像 LLaMA-Factory20250424(自动启动WebUI) 或者LLaMA-Factory20250424(手动启动WebUI)即可使用
LLaMA-Factory20250424(自动启动WebUI) 开机后，会自动启动Web UI服务
LLaMA-Factory20250424(手动启动WebUI)开机后，需要通过命令手动启动服务：llamafactory-cli webui

实例运行后，可通过“我的实例”页面中的服务链接进行访问。

Screenshot 2025-04-18 at 14.08.19.png

二、亲自部署 LLaMA-Factory

如果想亲自在实例上部署LLaMA-Factory，则步骤如下：

启动实例

显卡型号：4090 24G显存（为保证下载速度，请选择亚太 2 区的机器）

镜像：Pytorch 2.5.1

配置端口号： 8080（WebUI 服务） 11434（API 服务）

设置环境变量：GRADIO_SERVER_PORT=8080 （定义 Gradio webUI 服务的端口号，注：环境变量只能在 terminal 中查看，notebook 无法查看）

去除国内镜像源

如果您使用的是亚太 2 区的机器，则在部署之前，先去除默认的国内 pip 源：

具体方法在matpool主站右下角点击“客服”寻问AI客服：“如何去除pip源”

Screenshot 2025-04-18 at 13.59.38.png

安装LLaMA-Factory

实例中运行：

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

启动服务

实例中运行：

llamafactory-cli webui #注意请在LLaMA-Factory目录下运行这条命令

注：如果实例不在亚太2区，则配置从modelscope下载模型

USE_MODELSCOPE_HUB=1 llamafactory-cli webui
# USE_MODELSCOPE_HUB 设为 1，表示模型从 ModelScope 魔搭社区下载。避免从 HuggingFace 下载模型导致网速不畅。

服务启动后，可通过“我的实例”页面中的服务链接进行访问。

三、使用LLaMA-Factory 微调模型

准备数据集

LLaMA-Factory 项目内置了丰富的数据集，放在了 data 目录下。您可以跳过本步骤，直接使用内置数据集。您也可以准备自定义数据集，将数据处理为框架特定的格式，放在 data 下，并且修改 dataset_info.json 文件。

如果直接使用了人LLama-Factory镜像，则用户可直接在data目录下查看到 images文件夹和train.json 数据集，并且已经在`dataset_info.json `中加入train数据集。

Screenshot 2025-04-18 at 14.18.42.png

如果是按照步骤二自己部署的 LLaMA-Factory，则可自行下载数据集并存放到 data 目录：

wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/llama_factory/Qwen2-VL-History.zip
mv data rawdata && unzip Qwen2-VL-History.zip -d data # 这一步会将原LLaMA-Facroty 目录下的 data 文件转移到rawdata中

数据集中的样本为单轮对话形式，含有 261 条样本，每条样本都由一条系统提示、一条用户指令和一条模型回答组成，微调过程中模型不断学习样本中的回答风格，从而达到学习文旅知识的目的。数据样例如下所示：

Screenshot 2025-04-18 at 14.49.55.png