XTuner微调LLM：1.8B、多模态和Agent-笔记四

一棵二叉树

已于 2024-04-27 11:06:50 修改

阅读量232

点赞数 3

文章标签：笔记

于 2024-04-26 23:43:28 首次发布

本文链接：https://blog.csdn.net/qq_46576562/article/details/138232914

版权

本次课程由XTuner 贡献者李剑锋、汪周谦、王群老师讲解【XTuner 微调 LLM：1.8B、多模态和 Agent】课程

两种Finetune范式

若直接用预训练的模型或增量预训练模型，可能不能回答用户的问题；经过该领域的指令微调，模型以对话的方式准确回答用户的问题。例如：

数据处理流程：

原始数据->标准格式数据->添加对话模板->Tokenized数据->添加Label

高效微调方法：LoRA、QLoRA

XTuner:

LLaMa-Factory和Xtuner性能对比

Xtuner快速上手示例

InternLM2 1.8B模型

InternLM2-1.88:具有高质量和高适应灵活性的基础模型，为下游深度适应提供了良好的起点。
InternLM2-Chat-1.8B-SFT:在 InternLM2-1.88 上进行监督微调(SFT)后得到的对话模型。
InternLM2-Chat-1.88:通过在线 RLHF 在 InternLM2-Chat-1.8B-SFT 之上进一步对齐。InternLM2-Chat-1.88 表现出更好的指令跟随、聊天体验和函数调用,推荐下游应用程序使用。(模型大小仅为3.78GB)

关注