LLamafactory训练Qwen2 7B大模型记录

最新推荐文章于 2024-09-24 09:58:56 发布

痔知识

最新推荐文章于 2024-09-24 09:58:56 发布

阅读量123

点赞数

文章标签：机器学习人工智能深度学习算法

使用的数据集CoT_chinese_data, alpaca_gpt4_data_zh, gaokao三个数据集合计是74771条数据，A100 * 2 80G 训练了一天。

训练命令：

llamafactory-cli train \
    --stage sft \
    --do_train True \
    --model_name_or_path /data/llmservice/modes/Qwen2-7B/qwen/Qwen2-7B \
    --preprocessing_num_workers 16 \
    --finetuning_type lora \
    --template default \
    --flash_attn auto \
    --dataset_dir data \
    --dataset CoT_Chinese_data,alpaca_gpt4_data_zh,gaokao \
    --cutoff_len 8192 \
    --learning_rate 5e-05 \
    --num_train_epochs 3.0 \
    --max_samples 100000 \
    --per_device_train_batch_size 3 \
    --gradient_accumulation_steps 8 \
    --lr_scheduler_type cosine \
    --max_grad_norm 1.0 \
    --logging_steps 5 \
    --save_steps 100 \
    --warmup_steps 0 \
    --optim adamw_torch \
    --packing False \
    --report_to none \
    --output_dir saves/Qwen2-7B/lora/train_2024-08-04-08-50-31 \
    --fp16 True \
    --plot_loss True \
    --ddp_timeout 180000000 \
    --include_num_input_tokens_seen True \
    --lora_rank 8 \
    --lora_alpha 16 \
    --lora_dropout 0 \
    --use_rslora True \
    --use_dora True \
    --lora_target all \
    --deepspeed cache/ds_z3_config.json

训练曲线：

LLamafactory训练Qwen2 7B大模型记录_json

原创作者: u_16639863 转载于: https://blog.51cto.com/u_16639863/11662109

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

痔知识

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-10

2万+

使用LLaMA-Factory高效微调qwen2-7b-instruct

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100（八）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-21

7491

使用LLaMA-Factory高效微调qwen2-7b-instruct

参与评论您还未登录，请先登录后发表或查看评论

AI大模型 | 基于LLaMA-Factory框架对Qwen2-7B模型进行微调实践

weixin_41407229的博客

08-21

102

一、引言在当前人工智能的发展中，大型语言模型（LLMs）已成为NLP研究和应用的关键。Qwen2-7B模型作为领域的领先者，以其巨大的参数量和强大的功能获得了广泛注意，尤其是它在经过微调后能更好地完成特定任务。本文旨在详述如何运用LLaMA-Factory框架高效微调Qwen2-7B模型，以优化其在特定任务中的表现。二、L...

基于LLaMA-Factory框架对Qwen2-7B模型进行微调实践

xx_nm98的博客

08-15

930

支持包括Qwen2-7B在内的多种大型语言模型。它通过集成如LoRA、QLoRA等先进的微调算法，以及提供丰富的实验监控工具，如LlamaBoard、TensorBoard等，为用户提供了一个便捷、高效的微调环境。此外，LLaMA-Factory还支持多模态训练方法和多硬件平台，包括GPU和Ascend NPU，进一步拓宽了其应用范围。

【Qwen2微调实战】LLaMA-Factory框架对Qwen2-7B模型的微调实践

寻道码路，探索编程之路的无限可能。

07-29

8241

在人工智能的浪潮中，大型语言模型（LLMs）正逐渐成为研究和应用的热点。它们在自然语言处理（NLP）的各个领域，如文本生成、翻译、问答等任务中展现出了卓越的能力。Qwen2-7B模型，作为该领域的佼佼者，不仅因其庞大的参数量和强大的表示能力受到关注，更因其在微调后能够更好地适应特定任务而备受关注。本文将详细介绍如何利用LLaMA-Factory这一高效的微调框架对Qwen2-7B进行微调，以期达到提升模型在特定任务上的表现。

【Qwen2微调实战】LLaMA-Factory框架对Qwen2-7B模型的微调实践_llamafactory qwen2

月流霜的专栏

08-20

479

本文将详细介绍如何利用LLaMA-Factory这一先进的微调框架，对Qwen2-7B模型进行细致的调整和优化。在本文中，我们将从环境配置、模型下载、参数设置、模型训练、导出等多个维度，全面展示如何使用LLaMA-Factory对Qwen2-7B进行微调。我们将提供详细的步骤说明和实践案例，确保读者能够复现并根据自己的需求调整微调过程。LLaMA-Factory是一个集多种微调技术于一身的高效框架，支持包括Qwen2-7B在内的多种大型语言模型。

【机器学习】Qwen2大模型原理、训练及推理部署实战

人工智能领域博客

06-10

1万+

本文首先对Qwen2模型概述以及模型架构进行讲解，接着基于llama_factory命令行的方式进行模型训练演示，最后基于hf transformers进行模型推理的讲解。过程中排了好几个坑，呈上的代码保证在国内网络环境下是可运行的。希望能帮助到大家

llama factory学习笔记

weixin_41046245的博客

03-08

2977

这些命令行参数用于在单GPU上进行不同类型的模型训练，包括预训练、指令监督微调、奖励模型训练和PPO训练。首先配置accelerate,输入只有accelerate config，剩下的内容都是选项。这里我们看到llama factory的预训练也是基于lora进行预训练的。那么接下来我们尝试多卡进行 qwen/Qwen-14B lora 预训练。如果您使用多张 GPU 训练模型，请移步。您已经成功地为多GPU训练环境配置了。

开源探索时刻！在LLaMA-Factory上实现GLM-4和Qwen2的工具格式化

在数字化道路无限探索

06-25

1198

在LLaMA-Factory上实现GLM-4和Qwen2的工具格式化

开源模型应用落地-qwen2-7b-instruct-LoRA微调&模型合并-LLaMA-Factory-单机多卡-RTX 4090双卡（六）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-16

1万+

使用LLaMA-Factory合并微调后的模型权重

开源模型应用落地-Qwen2-7B-Instruct-Lora与vllm-单机多卡-RTX 4090双卡（十五）

最新发布

liguandong

09-24

382

本文介绍了如何使用LLaMA-Factory微调Qwen1.5模型，包括1.8B和0.5B版本的训练细节。在数据、训练、LORA融合及推理等方面进行了探讨，同时也分享了微调后模型在不同任务上的表现，如聊天对齐和显存占用等。在4卡A800-80G上微调的，数据不变。但是由于llamafactory更新了版本，因此训练命令也有所变化。llama_factory微调QWen1.5_llama factory qwen-CSDN博客。注意训练数据要同步往llamafactory的dataset文件中拉取一份。

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

老牛啊

06-12

8247

阿里云正式开源通义千问Qwen2系列模型，其中Qwen2-72B成为全球性能最强的开源模型，在全球权威测评中，性能超过美国最强开源模型Llama3-70B，也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。今天老牛同学部署和体验Qwen2-7B中等尺寸模型，包括本地部署、API嗲用和WebUI对话客户端……

Qwen2大语言模型微调、导出、部署实践

liguiyuan的博客

06-16

2568

上篇文章：我们介绍了Qwen1.5 大语言模型使用LLaMA-Factory 来微调，这篇文章我们介绍一下微调后模型的导出、部署。

使用llama-factory和llama.cpp微调量化Qwen2

weixin_48597428的博客

07-19

885

在目录LLaMA-Factory/examples/train_lora/llama3_lora_sft_praise.yaml。2.将处理好的数据集上传到/data 文件夹下面，并修改dataset_info.json文件。生成模型将会放在LLaMA-Factory/saves下面。将合并后的模型转化为fp16精度的gguf格式文件。量化为int4精度的模型。1.选定数据集的格式。自己的测试acc脚本。

只需30分钟，微调阿里 Qwen2-7B，搭建专属 AI 客服

weixin_43829633的博客

06-07

2326

LLaMA-Factory 在data文件夹中提供了多个训练数据集示例，支持alpaca或sharegpt格式，不过我这里使用的是自己提前导出来做过处理的自定义数据集。自定义数据集选用alpaca因为我只有标注后的问答对，所以只需要填充和output部分即可，下面是部分数据，保存为 bajigo.json，并上传到 LLaMA-Factory 的 data 目录下。"instruction": "我能建两份菜单然后自行切换吗","output": "你好，暂不支持同时创建多个菜单。

微调神器LLaMA-Factory官方保姆级教程来了，从环境搭建到模型训练评估全覆盖

lqfarmer的博客

07-06

1889

数据集的格式要求在不同的阶段是不同的，本教程以sft阶段的数据集需求，将以系统自带的identity数据集和将自定义的一个商品文案生成数据集为例，介绍数据集的使用。更多详情可以在https://github.com/hiyouga/LLaMA-Factory/blob/main/data/README_zh.md 中找到相关解释。系统目前支持 alpaca 和sharegpt两种数据格式，以alpaca为例，整个数据集是一个json对象的list，具体数据格式为。

【03】LLaMA-Factory微调大模型——多模型部署

H66778899的博客

07-17

2143

【03】LLaMA-Factory微调大模型——多模型部署

LLaMA-Factory+qwen多轮对话微调测评

kk的博客

04-02

5641

LLaMA-Factory+qwen多轮对话微调

探索Qwen2-7B大模型压缩包的深层次解读

Qwen2-7B 模型的 "model-00004-of-00004.safetensors" 文件是一个表明了其为特定大模型的分片文件。这类文件的处理需要考虑到数据的安全性、存储和传输的效率以及最终的模型整合。在处理此类大型模型文件时，安全性...