(LLaMa Factory)大模型训练方法--监督微调（Qwen2-0.5B）

最新推荐文章于 2025-03-27 19:49:13 发布

风起晨曦

最新推荐文章于 2025-03-27 19:49:13 发布

阅读量769

点赞数 9

文章标签： llama

本文链接：https://blog.csdn.net/weixin_63373973/article/details/145656180

版权

1、准备训练数据：SFT 的数据格式有多种，例如：Alpaca格式、OpenAI格式等。

#其中Alpaca格式如下：

[
  {
    "instruction":"human instruction (required)",
    "input":"human input (optional)",
    "output":"model response (required)",
    "system":"system prompt (optional)",
    "history":[
      [
"human instruction in the first round (optional)","model response in the first round (optional)"
      ],
      [
"human instruction in the second round (optional)","model response in the second round (optional)"
      ]
    ]
  }
]

根据以上的数据格式，我们在ModelScope的数据集找到中文医疗对话数据-Chinese-medical-dialogue符合上述格式。

# 使用git命令拉取数据集 至data目录下
git clone https://www.modelscope.cn/datasets/xiaofengalg/Chinese-medical-dialogue.git /mnt/workspace/LLaMA-Factory/data

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

风起晨曦

关注关注

9
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

LLM - 使用 LLaMA-Factory 微调 Qwen2-VL SFT(LoRA) 图像数据集教程 (2)

AGI

11-12

2919

LLaMA-Factory 是开源的大模型微调框架，用于高效地微调和部署大语言模型，支持多种预训练模型和微调算法，提供完整的工具和接口，对于预训练的模型进行定制化的训练和调整，以适应特定的应用场景。

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100（八）

没有卑微的工作，只有卑微的心态，与其抱怨，不如埋头实干

08-21

8298

使用LLaMA-Factory高效微调qwen2-7b-instruct

参与评论您还未登录，请先登录后发表或查看评论

(LLaMa Factory)大模型训练方法--准备模型（Qwen2-0.5B）

weixin_63373973的博客

02-15

613

1、准备训练框架是一款开源低代码大模型微调框架，集成了业界最广泛使用的微调技术，支持通过Web UI界面零代码微调大模型，目前已经成为开源社区内最受欢迎的微调框架。

一文学会 Qwen2-0.5B+Lora+alpaca_zh 微调实战，附完整可运行源代码

最新发布

AI与算法都要通俗易懂

03-27

639

预训练大模型在训练过程中，虽然学到了很多通用知识，但是很多时候，大模型本身并不能在专业领域表现得非常好。比如你让 Qwen 模型回答“量子力学中的叠加态是什么”，它可能会给出一个笼统的解释，但要是让模型严格按照某一格式（比如论文格式）回答时，可能就不太行。除非你在上下文聊天中给他一些例子让他先自我学习。这也被称为“上下文学习能力 + Few-shot”的方式，但这并不改变模型的本质。一旦你切换了与模型聊天的上下文，模型又会恢复到它原来的样子。

基于 Qwen-0.5B Lora 微调训练英语问答任务

qq_44117805的博客

10-07

2893

Qwen是阿里巴巴集团的Qwen团队研发的一个大语言模型系列，包含了语言模型和多模态模型。本文是使用了Lora微调的方法对qwen进行微调，使得模型在自己的数据集上更加准确

OrangePi Zero3部署Qwen2 0.5B

j_kkko的博客

06-23

2045

在OrangePi Zero3上部署Qwen2 0.5B模型

本地模型Qwen2-0.5B-Instruct结合faiss实现RAG

NLPnoproble的博客

08-06

1056

print(f"与查询文本相似度最高的文本是: {texts[max_similarity_idx]}")# print(f"与查询文本相似度最高的文本是: {texts[max_similarity_idx1]}")print(f"文本 {i + 1} 与查询文本的相似度: {similarity:.4f}")print(f"与查询文本相似度最高的文本是: {texts[max_similarity_idx]}")下面需要注意的是数据只能是TXT文本，如果需要其他格式的要你自己改。

QLoRA 微调Qwen1.5-0.5B-Chat

机器学习，深度学习

08-05

1133

本文实战使用QLoRA技术微调阿里的Qwen1.5-0.5B-Chat模型，采用single-gpu 进行训练。

(LLaMa Factory)大模型训练方法--预训练（Qwen2-0.5B）

weixin_63373973的博客

02-15

1168

❗由于大模型的预训练需要数千个GPU并持续数月的时间，所以一般情况下实际工作中并不会涉及到预训练，本篇文章我们只做的简单流程体验。：LLaMa-Factory的Github上有训练数据格式的详细说明，请见README_zh。: 在 LLaMa-Factory的WebUI界面上，选择Dataset为。：在saves/Qwen2-0.5B/full目录下,可以查看到。中按照以下格式注册自定义的数据集。预览命令行无误后，点击。

使用Docker容器部署Qwen2-0.5B模型记录

xuptyjs的博客

10-24

669

修改serve_model.py中的路径名称，这里由于我已将本地路径D:/Qwen2-0.5b挂载到容器中的app文件夹下，所以我直接在本地修改代码即可，再次运行，成功！进入容器之后发现app文件夹下没有serve_model.py文件，不清楚哪里出了问题，通过在宿主机路径下手动添加该文件，同时容器中也会对应添加。后台模式：容器在后台运行，终端可继续运行其他操作（本次采用这种）交互模式：提供一个可与容器进行交互的界面。

基于 Qwen2.5-0.5B 微调训练 Ner 命名实体识别任务

小毕超博客

09-30

5428

Qwen2.5 是 Qwen 大型语言模型的最新系列，参数范围从 0.5B 到 72B 不等。大大提高了编码和数学能力。在指令跟随、生成长文本（超过 8K 个标记）、理解结构化数据（例如表格）以及生成结构化输出（尤其是 JSON）方面有了显著改进。

llama.cpp运行qwen0.5B

qq_36437991的博客

04-02

2173

llama.cpp运行qwen0.5B大模型

大模型微调---qwen实战

qq_42178122的博客

08-30

4909

Qwen是阿里云开发的大语言模型，整个qwen系列的模型，由base模型、rm模型、chat模型、code模型、math模型等等。qwen采用chatml样式的格式来进行模型训练，chatml格式可以时模型有效区分各类信息，可以增强模型对复杂会话的处理分析能力。对于每个问题，给出若干答案，然后工人进行排序，而奖励模型就是利用排序的结果来进行反向传播。

LLM实验初体验：linux系统部署大模型qwen1.5-0.5b、qwen2.0

jyf1_的博客

05-28

3504

LLM部署实验

内网环境使用Docker部署Qwen2模型

weixin_44455388的博客

06-21

3131

在我参与的一个国企项目中，我们基于大语言模型开发了一些应用，但是甲方公司所有的资源环境都是纯内网。更为有趣的是，甲方公司已自主搭建并运行着一套百度机器学习平台（BML），客户要求所有的大模型部署必须依托于现有的BML平台进行，而非独立构建全新的基础设施，资源申请也相当严苛。面对这一系列限定条件，我们只能试着利用Docker容器技术进行大语言模型的部署。

LLaMA-Factory+qwen多轮对话微调测评

kk的博客

04-02

9525

LLaMA-Factory+qwen多轮对话微调

基于 Qwen2 大模型微调技术详细教程（LoRA 参数高效微调和 SwanLab 可视化监控）

老牛啊

07-20

3579

本教程详细介绍了 LoRA 参数高效微调技术，包括数据集准备和处理、模型加载、参数设置等，然后以 Qwen2-0.5B 预训练模型实践，进行了文本分类能力微调，微调过程通过 SwanLab 可视化界面查看，最终微调模型进行测试数据评估……

【大模型】0.5B的大模型通义千问1.5-0.5B-Chat来了！！

Zack的博客

02-17

4513

通义千问1.5-0.5B-Chat

llama-factory微调qwen2-0.5b会中途kill掉

03-26

参照 LLaMA Factory 文档说明引入更多超参控制选项以便更好地适配目标设备性能特征 : ```python from transformers import TrainingArguments, Trainer training_args = TrainingArguments( output_dir="./...