llama-factory微调qwen2.5-vl

置顶

魔障阿Q

于 2025-04-08 17:54:45 发布

阅读量1.2k

点赞数 27

文章标签： llama 人工智能计算机视觉

本文链接：https://blog.csdn.net/qq_44908396/article/details/147073114

版权

本文不生产技术，只做技术的搬运工！！！

前言

目前大模型百花齐放，微调方法复杂多样，且教程复杂，工程端想要进行垂域模型适配困难重重，本篇博客详细介绍了qwen2.5-vl的全流程微调过程，包括环境配置、数据集制作、模型训练、模型导出、模型部署、模型推理等过程，希望对工程端的朋友们有帮助。

环境配置

一定注意微调环境和推理环境要隔离，避免版本冲突

Llama-factory安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

推理环境安装

git clone https://github.com/QwenLM/Qwen2.5-VL.git
cd Qwen2.5-VL
conda create -n qwen2.5-vl python=3.11 -y
pip install -r requirements_web_demo.txt
pip install flash-attn==2.6.1
pip install vllm==0.7.3

数据集制作

数据格式

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

魔障阿Q

关注关注

27
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

LLM - 使用 LLaMA-Factory 微调 Qwen2-VL SFT(LoRA) 图像数据集教程 (2)

AGI

11-12

2888

LLaMA-Factory 是开源的大模型微调框架，用于高效地微调和部署大语言模型，支持多种预训练模型和微调算法，提供完整的工具和接口，对于预训练的模型进行定制化的训练和调整，以适应特定的应用场景。

llamafactory0.9.0微调qwen2.5

liguandong

09-24

1104

本文介绍了如何使用LLaMA-Factory微调Qwen1.5模型，包括1.8B和0.5B版本的训练细节。在数据、训练、LORA融合及推理等方面进行了探讨，同时也分享了微调后模型在不同任务上的表现，如聊天对齐和显存占用等。在4卡A800-80G上微调的，数据不变。但是由于llamafactory更新了版本，因此训练命令也有所变化。llama_factory微调QWen1.5_llama factory qwen-CSDN博客。注意训练数据要同步往llamafactory的dataset文件中拉取一份。

参与评论您还未登录，请先登录后发表或查看评论

llama-factory微调Qwen2.5-7B-instruct实战，看这一篇就够了！！！（含windows和linux）

a1105425455的博客

03-20

1041

llama-factory微调Qwen2.5-7B-instruct实战，看这一篇就够了！！！（含windows和linux）

LLaMA-Factory微调sft Qwen2.5-VL-7B-Instruct

q742971636的博客

03-17

1444

"content": "你是一个擅长识别印章上文字的助手，输出json字符串给用户。",},"content": "<image>识别图片里红色印章上的公司名称或单位名称（印章主文字）。",},"content": "{\"印章主文字\": \"饮酒太原近似收益有限公司\"}",],"seal": {},"tags": {

【从零开始系列】Qwen2.5 & Llama-Factory：开源语言大模型+训练平台——（超详细、最新版）一篇文章解决：环境搭建 =＞微调训练 =＞本地部署

qq_58718853的博客

01-13

5625

使用llama-factory大语言模型微调高效平台，对qwen2.5官方预训练模型进行微调并部署

使用 ollama 部署本地模型，零基础入门到精通，非常详细收藏我这一篇就够了

m0_65555479的博客

08-15

2931

在本地启动并运行大型语言模型。运行Llama 2，Code Llama和其他模型。自定义并创建您自己的。

LLama-Factory 快速部署Qwen2.5模型

q742971636的博客

11-04

891

【代码】LLama-Factory 快速部署Qwen2.5模型。

手把手教你如何全参微调QWEN2.5

SuperTi_cloud的博客

12-24

1053

本次实战采用QWEN2.5的0.5b的小体量模型在弱智吧数据集上进行微调。通过本次实战，希望大家能够掌握以下技能：1，如何快速获取廉价算力2，如何在QWEN模型上进行全参微调。

【从零开始】11. LLaMA-Factory 微调 Qwen 模型（番外篇）

Kida 的技术小屋（CSDN 版）

12-29

1613

本文将从部署开始，详细讲一下如何使用 llamafactory 对开源模型进行指令微调了，并且在微调过程中我是如何一次一次地进行参数调整的，我也跟各位分享一下。

qwen2.5-vl-7B视觉大模型私有化部署webUI

weixin_42684822的博客

02-08

5171

在云服务上，私有化部署qwen2.5-vl视觉大模型

LLM - 使用 LLaMA-Factory 微调 Qwen2-VL DPO(LoRA) 图像数据集教程 (3)

AGI

11-26

2375

DPO(Direct Preference Optimization, 直接偏好优化) 是在 RLHF 阶段中使用的优化算法，通过直接利用人类的偏好数据来优化策略模型，无需定义明确的奖励函数或进行复杂的强化学习过程。DPO的优化目标是，增加偏好样本的对数概率与减小非偏好样本响应的对数概率，结合动态加权机制，以避免仅使用概率比目标时遇到的模型退化问题。

llama-factory 微调 qwen2.5-vl

热门推荐

HovChen的博客

01-28

1万+

本篇文章介绍了如何使用 LoRA（Low-Rank Adaptation）技术对 Qwen2.5-VL-7B-Instruct 进行轻量级微调，从而高效适配特定任务。我们详细解析了模型加载、数据预处理、LoRA 适配、训练配置及推理评估的完整流程，并提供了代码示例。通过 LoRA，我们可以在较低计算资源下快速微调大规模视觉-语言模型（VLMs），使其更适用于特定领域任务。对于希望优化 Qwen2.5-VL 并实现高效微调的开发者，本文提供了一套实用的解决方案。🚀

LLaMA-Factory微调Qwen2.5-7B模型

qq_46325481的博客

02-19

2142

本次实验环境使用的魔塔社区的机子。

llamafactory0.9.0微调qwen2vl

liguandong

09-24

821

llamafactory cli中的chat是不支持输入图片的，因此输入图片只能通过webchat来实现。改一下src/llamafactory/webui/inference.py中的87行，加一个server_port即可。Qwen2VL微调数据集的图片数量有无限制 · Issue #5375 · hiyouga/LLaMA-Factory · GitHub。其实llamafactory 0.9.0真不如以前的方式，现在的llamafactory-cli不好用，并不适合算法人员。

qwen2vl 训练记录

谁怕平生太急

10-16

1182

image_grid_thw’: tensor([[ 1, 98, 146]], device=‘cuda:0’)}} 三个维度的大小时间、高度、宽度 grid_t, grid_h, grid_w。4、qwen2vl lora训练时，可以设置 freeze_vision_tower为false、增加的参数量大概在 0.06%（图片限制在 512token时）/ 0.4%（图片在3300token时）因为图片和视频帧的同步、乘以2、所以高度（即宽度） = 49 * 2 = 98。

LLaMA-Factory多机多卡训练实战

q742971636的博客

03-17

548

参考资料：https://llamafactory.readthedocs.io/zh-cn/latest/advanced/distributed.html以训练qwen2.5vl 7b 为例子。more。