2024山东大学软件学院创新项目实训(1)什么是大模型微调

学习视频网址:

XTuner 大模型单卡低成本微调实战_哔哩哔哩_bilibili

一、什么是微调(Finetune)

大模型中常用的两种微调方式:增量预训练微调,指令跟随微调

(一)增量预训练微调

使用场景:让基座模型学习到一些新知识,如某个领域的知识

训练数据:文章,书籍,代码等

(二)指令跟随微调

使用场景:让模型学会对话模板,根据人类指令进行对话

训练数据:高质量的对话,问答数据

一个能更直观的描述指令跟随微调作用的图

在没有进行指令微调之前,大模型并不能准确识别出“什么是肺癌?”这句话是一个问题,他只会根据文本匹配来输出结果。而进行了指令微调后,大模型才知道,这是一个问题,我应该给出怎样的回答。

二、Xtuner中使用的微调方法

LoRA&QLoRA

(一)LoRA(Low-Rank Adaptation of Large Language Models)

LLM的参数量主要集中在模型中的Linear,训练这些参数会耗费大量的显存。LoRA通过在原本的Linear旁,新增一个支路,包含两个连续的小Linear,新增的这个支路通常叫做Adapter。
Adapter 参数量远小于原本的 Linear,能大幅降低训练的显存消耗

(二)QLoRA

在加载模型的时候使用4-bit量化,能够节省显存。并且优化器可以在GPU和CPU之间进行调度,其他和LoRA一样。

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值