使用llama-factory框架下的QWEN2-VL-2B-Instruct跑通图像指令数据集(学习记录)

第一次记录,多多包涵

1.环境配置,这里的pytorch环境最好是直接下包,不然后面会出现各种各样的错误

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

2.模型,这里我用的是Qwen/Qwen2-VL-2B-Instruct,可以做多模态的模型,可以直接在魔塔社区下载,也可以在hugging face下载。

 3.显卡,这里我用的是我们学校的一个3090的服务器,可以使用这个指令上传文件到服务器

 scp -r "your_data_path" aaa.000.000.00.00:~/wwz

4.数据集,这里我要跑的是一个其他项目的数据集,那个项目使用的是mplug-owl2模型,我把他的一部分数据集下载下来,并对其进行数据处理。

这个图片数据集本身是有12000多张图片,但是我只下载了他的train.json,所以要根据train.json里对每张图片的描述,对这个图片数据集进行处理,保留只在

### 使用 `llama.cpp` 部署 Qwen2-VL-7B 模型 为了高效运行并部署 Qwen2-VL-7B 模型,可以采用 `llama.cpp` 进行一键部署。此方法不仅简化了部署流程还提高了模型的执行效率。 #### 环境准备 确保开发环境中已安装 Git 和 CMake 工具,这些工具对于后续操作至关重要[^2]。 #### 获取和编译 llama.cpp 1. **克隆仓库** 执行如下命令来获取最新的源码: ```bash git clone https://github.com/ggerganov/llama.cpp.git cd llama.cpp ``` 2. **编译项目** 编译过程依赖于 Makefile 或者 CMakeLists.txt 文件,在 Unix-like 系统上可以直接使用 make 命令完成编译工作;而在 Windows 上则推荐利用 MinGW-w64 来构建。 ```bash make ``` #### 下载 Qwen2-VL-7B 的 GGUF 文件 访问官方资源页面下载适用于该框架下的预训练权重文件(常为 .bin 或其他二进制格式),并将之放置到指定目录下以便加载。 #### 加载模型与处理器 一旦完成了上述准备工作之后,则可以过 Python 脚本调用 HuggingFace 提供的相关 API 接口实现对模型实例化以及数据处理功能的支持: ```python from transformers import Qwen2VLForConditionalGeneration, AutoProcessor model = Qwen2VLForConditionalGeneration.from_pretrained("path/to/local/model") processor = AutoProcessor.from_pretrained("path/to/local/model") ``` 请注意这里的路径应当指向之前所提到过的本地存储位置而非远程地址[^1]。 #### 启动服务端接口 为了让外部应用能够方便地请求推理结果,还需要搭建 RESTful Web Service 或 gRPC Server 形式的网络服务器作为中介层连接客户端和服务端之间的信链路。这一步骤具体取决于个人喜好和技术栈的选择,比如 FastAPI、Flask 或 Django Rest Framework 等都是不错的选择之一。 #### 测试 API 功能性 最后可过发送 HTTP 请求的方式验证整个系统的可用性和稳定性,例如借助 Postman 或 curl 实现简单的 GET/POST 方法测试: ```bash curl -X POST "http://localhost:8000/infer" \ -H "Content-Type: application/json" \ -d '{"input": ["your input text here"]}' ``` 以上就是基于 `llama.cpp` 对 Qwen2-VL-7B 模型进行快速部署的一个完整流程介绍。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值