部署和微调Qwen1.5-7B

最新推荐文章于 2025-03-16 08:00:00 发布

kerrigen1

最新推荐文章于 2025-03-16 08:00:00 发布

阅读量1.1k

点赞数 3

分类专栏：模型部署文章标签： python 语言模型

本文链接：https://blog.csdn.net/kerrigenwan/article/details/141058444

版权

前言

小白微调部署笔记
系统：
图形化Ubuntu20.04
主要硬件：
RTX4090 24G
使用的工具：
Miniconda、pip、git等
Ubuntu系统初始化配置：
1.安装vim编辑器

sudo apt install vim

2.安装Miniconda
自行查找教程安装

一、部署

1.创建下载路径并切换到下载路径

mkdir modes
cd modes

2.下载Qwen1.5-7B源代码

git clone https://github.com/QwenLM/Qwen.git

3.养成好习惯，使用conda创建conda环境，然后激活创建的环境

conda create -n qwen1.5 python==3.10.1
conda activate qwen1.5

4.在conda环境中安装pytorch
在安装之前建议先升级pip版本

python -m pip install --upgrade pip

然后安装pytorch（这里需要根据自己的GPU来选择合适的pytorch版本）
新开一个终端使用命令查询支持的cuda版本

nvidia-smi

然后去官网：https://pytorch.org/get-started/locally/#/选择合适的版本下载即可
在这里插入图片描述

pip3 install torch torchvision torchaudio

没看懂的自行百度学习
5.使用pip安装模型运行的项目依赖

pip install -r requirements.txt

6.切换至模型源代码位置

cd Qwen

7.下载魔塔社区的权重模型
在下载权重模型前需要先安装git-lfs这个工具

sudo apt-get install git-lfs

然后就可以初始化git lfs并且下载权重模型

git lfs install
git clone https://www.modelscope.cn/qwen/Qwen-7B-Chat.git

8.安装web UI的依赖包

pip install -r requirements_web_demo.txt

9.完成以上操作后就可以尝试运

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kerrigen1

关注关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

开源模型应用落地-qwen1.5-7b-chat-LoRA微调-Firefly（四）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

04-02

1万+

使用开源的Firefly大模型训练项目微调qwen1.5-7b-chat模型

开源模型应用落地-模型量化-Qwen1.5-7B-Chat-AWQ（二）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

05-17

1万+

理解AWQ模型量化技术，以低成本体验大语言模型的魅力

2 条评论您还未登录，请先登录后发表或查看评论

ModelScope+Transformers+SwanLab实现Qwen-1.5-7b的指令微调任务

Kashiwa123的博客

06-03

1411

利用ModelScope+Transformers+SwanLab高效实现Qwen-1.5-7b的指令微调任务，以支持文本分类任务

Qwen1.5模型微调部署全过程

徐的专栏

03-25

2016

CUDA_VISIBLE_DEVICES=-1 swift app-ui --ckpt_dir /home/qwen/output/qwen1half-4b-chat/v0-20240319-100101/checkpoint-350-merged --infer_backend pt --max_model_len 512 --server_name 0.0.0.0(cpu使用)#合并并直接界面运行未合并前会产生merged目录，合并后可直接运行merged目录模型。

通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践

嘴巴吃糖了

03-16

617

Qwen1.5（通义千问1.5）是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版，该模型推出了多个规模，从0.5B到72B，满足不同的计算需求。此外，该系列模型还包括了Base和Chat等多个版本的开源模型，为全球的开发者社区提供了空前的便捷性。阿里云的人工智能平台PAI，作为一站式的机器学习和深度学习平台，对Qwen1.5模型系列提供了全面的技术支持。无论是开发者还是企业客户，都可以通过PAI-QuickStart轻松实现Qwen1.5系列模型的微调和快速部署。

【AI开发：语言】二、Qwen1.5-7B模型本地部署CPU和GPU版

04-16

3911

Kobold和LM Studio各有千秋吧，一个是简单，另外一个就是功能多。所以在使用的时候我们可以根据自己的需求来选择。

[大模型]Qwen1.5-7B-Chat-GPTQ-Int4 部署环境

FL1623863129的博客

04-11

3741

Qwen1.5-72b 版本有BF16、INT8、INT4三个版本，三个版本性能接近。由于BF16版本需要144GB的显存，让普通用户忘却止步，而INT4版本只需要48GB即可推理，给普通用户本地化部署创造了机会。（建议使用4×24G显存的机器）但由于Qwen1.5-72B-Chat-GPTQ-Int4其使用了GPTQ量化技术，对环境依赖要求严格，需要较为复杂的环境准备步骤。在此提供环境准备教程。本教程以为例，同样适用于其他大小的GPTQ-Int4版本。

[大模型]Qwen1.5-7B-Chat 接入 LangChain 搭建知识库助手

FL1623863129的博客

04-11

2055

在 autodl 平台中租赁一个 3090 等 24G 显存的显卡机器，如下图所示镜像选择 PyTorch–>2.0.0–>3.8(ubuntu20.04)–>11.8接下来打开刚刚租用服务器的 JupyterLab，并且打开其中的终端开始环境配置、模型下载和运行 demo。pip 换源加速下载并安装依赖包。

[大模型]Qwen1.5-7B-chat Lora 微调

FL1623863129的博客

04-11

3658

LoraConfig这个类中可以设置很多参数，但主要的参数没多少，简单讲一讲，感兴趣的同学可以直接看源码。task_type：模型类型：需要训练的模型层的名字，主要就是attention部分的层，不同的模型对应的层的名字不同，可以传入数组，也可以字符串，也可以正则表达式。rlora的秩，具体可以看Lora原理lora_alphaLora alaph，具体作用参见Lora原理Lora的缩放是啥嘞？当然不是r（秩），这个缩放就是, 在这个LoraConfig中缩放就是4倍。

基于Qwen2.5-7B-Instruct的大模型微调实战指南

11-18

内容概要：本文档详细介绍了如何使用Qwen2.5-7B-Instruct大模型进行微调的具体步骤。主要内容包括环境搭建、预训练模型下载、微调准备工作、具体微调流程以及如何启用外部记录面板等。通过本文档，读者可以逐步掌握...

开源模型应用落地-Qwen1.5-MoE-1/3的激活参数量达到7B模型的性能

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

05-20

7039

使用Qwen1.5-MoE-A2.7B，体验更快的推理速度

qwen1.5-7B hf部署运行方法以及vllm推理框架部署方法

magic_road的博客

02-21

3149

qwen1.5 模型的问答生成方式发生了变化，不再支持 mode.chat()，但整体来看， 1.5版本的问答效果确实有了很大提升。qwen-7B 大语言模型的加载方式如下。

探索编程新篇章：上手CodeQwen1.5-7B-Chat模型指南

gitblog_02897的博客

12-19

517

探索编程新篇章：上手CodeQwen1.5-7B-Chat模型指南 CodeQwen1.5-7B-Chat 项目地址: https://gitcode.com/hf_mirrors/ai-gitcode/CodeQwen1.5-...

7、Qwen-7B 部署实践

Andy_shenzl的博客

04-01

4409

Qwen（通义千问）由阿里云团队研发，其训练数据覆盖多语言，但主要以中文和英文为主。Qwen的系列模型主要有两类，一类是基座模型Qwen，所谓基座模型，指的是在海量的数据集上进行预训练，这些数据集可能包含了广泛的主题、语境和样式，使得基座模型能够捕捉到丰富的语言特征和通用知识。另外一类是Chat类模型，是利用SFT和RLHF技术实现对齐，从基座模型训练得到对话模型。目前开源模型的参数规模为18亿（1.8B）、70亿（7B）、140亿（14B）和720亿（72B）。

Qwen-7B部署教程【Python调用+web端部署】

qq_36344652的博客

07-11

2797

在学习部署Qwen-7B的过程中，记录了整个过程，分享出来，希望能帮助同样有需求的人

Qwen1.5大语言模型微调实践

liguiyuan的博客

04-17

6058

在人工智能领域，大语言模型（Large Language Model，LLM）的兴起和广泛应用，为自然语言处理（NLP）带来了前所未有的变革。Qwen1.5大语言模型作为其中的佼佼者，不仅拥有强大的语言生成和理解能力，而且能够通过微调（fine-tuning）来适应各种特定场景和任务。本文将带领大家深入实战，探索如何对Qwen大语言模型进行微调，以满足实际应用的需求。

Qwen1.5的多框架部署使用指南

weixin_41046245的博客

03-28

2731

通过上述步骤，你可以轻松地使用vLLM和SGLang来部署和使用Qwen1.5。无论是进行聊天对话还是复杂的多轮问答，Qwen1.5都能提供高质量的语言模型服务。随着技术的不断进步，我们有理由相信，Qwen1.5将在更多领域大放异彩。在当今的技术领域，大型语言模型的应用日益广泛，而Qwen1.5作为其中的佼佼者，已经得到了多个推理框架的支持。首先，我们建议使用vLLM的0.3.0或更高版本来构建与OpenAI兼容的API服务。与vLLM类似，你需要启动一个服务器并使用与OpenAI兼容的API服务。

通义千问本地部署教程 Qwen-1.5-1.8B/7B/14B Windows-详细认真版

最新发布

03-18

### Qwen2-7B 模型本地部署与微调方法 #### 一、Qwen2-7B 的本地部署为了实现 Qwen2-7B 模型的本地部署，通常需要完成以下几个核心步骤： 1. **安装依赖库** 需要先确保环境中已安装必要的 Python 库。可以通过 `pip` 安装 Hugging Face 提供的相关工具包，例如 Transformers 和 Accelerate[^1]。 ```bash pip install transformers accelerate torch safetensors ``` 2. **下载模型权重** 如果无法直接从 Hugging Face 下载模型，则可以选择国内镜像站点获取预训练模型权重文件[^2]。 3. **加载模型并初始化处理器** 使用以下代码片段来加载 Qwen2-7B 模型及其对应的处理器对象。此部分展示了如何通过指定本地路径加载模型实例。 ```python from transformers import AutoModelForCausalLM, AutoTokenizer model_path = "/path/to/local/model" tokenizer = AutoTokenizer.from_pretrained(model_path) model = AutoModelForCausalLM.from_pretrained( model_path, trust_remote_code=True, torch_dtype=torch.float16, device_map="auto" ) ``` 4. **验证部署效果** 可以编写简单的推理脚本来确认模型是否正常工作。例如输入一段文本让模型生成后续内容。 --- #### 二、Qwen2-7B 的微调流程对于 Qwen2-7B 模型而言，微调可以帮助其更贴合特定应用场景的需求。以下是具体的实施方式： 1. **准备数据集** 数据应按照标准格式整理成 JSON 或 CSV 文件形式，并包含用于监督学习的任务标签或目标序列[^3]。 2. **定义超参数及优化器配置** 设置批量大小 (batch size)、学习率 (learning rate) 等关键参数，并选用适合当前任务类型的损失函数和评估指标体系。 3. **构建训练循环逻辑** 基于 PyTorch 或其他深度学习框架设计完整的训练管线结构。下面给出了一种典型做法示例代码: ```python from datasets import load_dataset from peft import LoraConfig, get_peft_model from transformers import TrainingArguments, Trainer dataset = load_dataset("your_custom_dataset") lora_config = LoraConfig( r=8, lora_alpha=32, target_modules=["q_proj", "v_proj"], lora_dropout=0.05, bias="none", task_type="CAUSAL_LM" ) peft_model = get_peft_model(model, lora_config) training_args = TrainingArguments( output_dir="./results", num_train_epochs=3, per_device_train_batch_size=4, gradient_accumulation_steps=2, learning_rate=2e-5, logging_dir='./logs', save_strategy='epoch' ) trainer = Trainer( model=peft_model, args=training_args, train_dataset=dataset["train"], eval_dataset=dataset["validation"] ) trainer.train() ``` 4. **保存与导出微调后的模型** 训练完成后记得将更新过的参数持久化存储下来以便日后重复利用或者分享给他人使用。 --- #### 总结通过对以上两部分内容的学习，能够较为全面地理解关于 Qwen2-7B 如何进行有效的本地部署以及高效的微调策略。这不仅有助于提升开发效率还能进一步挖掘大语言模型的实际价值所在。