【通义千问】大模型Qwen GitHub开源工程学习笔记（5）-- 模型的微调【全参数微调】【LoRA方法】【Q-LoRA方法】

大表哥汽车人

已于 2024-01-21 13:49:25 修改

阅读量2.5k

点赞数 23

分类专栏：人工智能、大语言模型学习笔记文章标签：学习笔记人工智能语言模型 LoRA 模型微调 Qwen

于 2024-01-07 23:23:52 首次发布

本文链接：https://blog.csdn.net/weixin_46481662/article/details/133819036

版权

人工智能、大语言模型学习笔记专栏收录该内容

22 篇文章 24 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详述了在自然语言生成中使用微调技术，重点探讨了LoRA和Q-LoRA两种低资源微调方法。LoRA通过在预训练模型权重上应用低秩分解矩阵，减少参数更新，而Q-LoRA进一步通过4比特量化降低内存开销。文中还介绍了两种方法的实现细节，包括训练数据准备、模型微调的步骤和内存管理策略。

摘要由CSDN通过智能技术生成

摘要：

本文介绍了使用微调技术进行自然语言生成的方法。通过使用transformers库中的AutoModelForCausalLM和AutoTokenizer，可以在多节点环境下进行微调。

训练数据的准备

你需要将所有样本放到一个列表中并存入json文件中。每个样本对应一个字典，包含id和conversation，其中后者为一个列表。示例如下所示：

[
  {
    "id": "identity_0",
    "conversations": [
      {
        "from": "user",
        "value": "你好"
      },
      {
        "from": "assistant",
        "value": "我是一个语言模型，我叫通义千问。"
      }
    ]
  }
]

微调方法分析

微调脚本能够帮你实现三种微调方法：

全参数微调
LoRA
Q-LoRA

【全参数微调在训练过程中更新所有参数。】

"全参数微调"是一种在机器学习中

了解本专栏

超级会员免费看

大表哥汽车人

关注

23
点赞
踩
35

收藏

觉得还不错? 一键收藏
打赏
6
评论
【通义千问】大模型Qwen GitHub开源工程学习笔记（5）-- 模型的微调【全参数微调】【LoRA方法】【Q-LoRA方法】

注意，如果你使用预训练模型进行LoRA微调，而非chat模型，模型的embedding和输出层的参数将被设为可训练的参数。秩分解矩阵可以看作是一种特殊的调料，它可以改变模型的行为，使模型更好地适应新的任务，但并不会改变原有的食材（即预训练模型的权重）。相比之下，LoRA将预训练模型的权重冻结，并在转换器架构的每一层注入可训练的秩分解矩阵。这意味着在这种方法中，原始的预训练权重 W 是固定的，不会在后续的训练过程中进行更新，而是只对 A 和 B 进行训练。在全参数微调中，所有的模型参数都会被重新训练。
复制链接

扫一扫