第四节笔记

一、大语言模型微调的理论和实践,包括增量预训练和指令微调两种范式,以及数据的标准格式和对话模板的重要性。
1、介绍x tune微调大语言模型和本节内容
2、讲解增量预训练和指令微调两种微调范式
讲解数据的标准化格式和对话模板的添加
二、大模型微调工具箱x2,它可以一键开始微调,适配多种微调算法和硬件,具有轻量级和快速训练的特点。
1、模型经过组装后的效果
2、对话模板的作用和训练中需要添加的起始符和结束符

3、x2是打包好的大模型微调工具箱,轻量级,支持多种微调算法和硬件,易于使用
三、如何使用X-Tuner工具来加速大语言模型的训练和对话过程,包括数据预处理、多模态大圆模型等内容。

1、使用pk pro max length来提升GPU利用率

2、X Tuner内置两种加速方式:flash attention和deep speed zero
3、1.8B模型是X Tuner中常用的一个最终版,拥有8GB显存的消费级显卡就能进行微调工作了
四、如何使用文本加图像的多模态模型进行预测,包括模型的训练和测试阶段,以及使用高质量数据进行微调的操作。
1、多模态模型通过增加图像输入和处理来预测输出文本

2、多模态指的是识图而不是生图,使用已有的文本单模态大语言模型训练出image projector

3、通过构造文本问题和图像输入数据对,使用L喇叭方案训练出image projector模型文件,增加视觉能力的过程
五、如何利用X推进行微调,并详细讲解了微调的步骤,包括准备开发机、安装环境、准备数据集和选择配置文件等。
1、通过X推完成个人小助手认知的微调

2、准备数据集,使用OpenAI数据集格式,重复同一句话生成数据集
六、如何使用BECULA PA13进行模型训练和转换,并提供了完整CONFIG文件和权重文件,以及如何进行对话测试。
 

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值