XTuner 大模型单卡低成本微调实战
一、Finetune简介
微调模式:增量预训练和指令跟随
增量预训练
指令微调模板
LoRA模型是旁路分支的参数文件,通常叫Adapter
区别:
全参数微调加载所有参数
LoRA:只加载LoRA参数,减少显存
QLoRA:使用4bit量化,CPU调度进行了整合
二、XTuner简介
XTuner 大模型单卡低成本微调实战
一、Finetune简介
微调模式:增量预训练和指令跟随
增量预训练
指令微调模板
LoRA模型是旁路分支的参数文件,通常叫Adapter
区别:
全参数微调加载所有参数
LoRA:只加载LoRA参数,减少显存
QLoRA:使用4bit量化,CPU调度进行了整合
二、XTuner简介