第四节笔记

最新推荐文章于 2024-07-22 16:24:23 发布

一泉超人876

最新推荐文章于 2024-07-22 16:24:23 发布

阅读量152

点赞数 2

文章标签：笔记机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_65433532/article/details/139621991

版权

一、大语言模型微调的理论和实践，包括增量预训练和指令微调两种范式，以及数据的标准格式和对话模板的重要性。
1、介绍x tune微调大语言模型和本节内容
2、讲解增量预训练和指令微调两种微调范式
讲解数据的标准化格式和对话模板的添加
二、大模型微调工具箱x2，它可以一键开始微调，适配多种微调算法和硬件，具有轻量级和快速训练的特点。
1、模型经过组装后的效果
2、对话模板的作用和训练中需要添加的起始符和结束符

3、x2是打包好的大模型微调工具箱，轻量级，支持多种微调算法和硬件，易于使用
三、如何使用X-Tuner工具来加速大语言模型的训练和对话过程，包括数据预处理、多模态大圆模型等内容。

1、使用pk pro max length来提升GPU利用率

2、X Tuner内置两种加速方式：flash attention和deep speed zero
3、1.8B模型是X Tuner中常用的一个最终版，拥有8GB显存的消费级显卡就能进行微调工作了
四、如何使用文本加图像的多模态模型进行预测，包括模型的训练和测试阶段，以及使用高质量数据进行微调的操作。
1、多模态模型通过增加图像输入和处理来预测输出文本

2、多模态指的是识图而不是生图，使用已有的文本单模态大语言模型训练出image projector

3、通过构造文本问题和图像输入数据对，使用L喇叭方案训练出image projector模型文件，增加视觉能力的过程
五、如何利用X推进行微调，并详细讲解了微调的步骤，包括准备开发机、安装环境、准备数据集和选择配置文件等。
1、通过X推完成个人小助手认知的微调

2、准备数据集，使用OpenAI数据集格式，重复同一句话生成数据集
六、如何使用BECULA PA13进行模型训练和转换，并提供了完整CONFIG文件和权重文件，以及如何进行对话测试。

一泉超人876

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第四节笔记

一、大语言模型微调的理论和实践，包括增量预训练和指令微调两种范式，以及数据的标准格式和对话模板的重要性。四、如何使用文本加图像的多模态模型进行预测，包括模型的训练和测试阶段，以及使用高质量数据进行微调的操作。五、如何利用X推进行微调，并详细讲解了微调的步骤，包括准备开发机、安装环境、准备数据集和选择配置文件等。二、大模型微调工具箱x2，它可以一键开始微调，适配多种微调算法和硬件，具有轻量级和快速训练的特点。3、x2是打包好的大模型微调工具箱，轻量级，支持多种微调算法和硬件，易于使用。
复制链接

扫一扫

一泉超人876 CSDN认证博客专家 CSDN认证企业博客

码龄3年

13: 原创

148万+: 周排名

11万+: 总排名

2373: 访问

: 等级

161: 积分

33: 粉丝

31: 获赞

1: 评论

26: 收藏

私信

关注

热门文章

最新评论

浦语笔记1
CSDN-Ada助手: 恭喜你开始了博客创作，希望你能坚持下去，不断分享自己的见解和心得。建议你在下一篇博客中可以尝试添加一些具体的案例或实例，让读者更容易理解你的观点。加油！期待你更多精彩的内容。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
浦语笔记1
CSDN-Ada助手: 恭喜你开始了博客创作之旅！《浦语笔记1》这个标题听起来就充满了诗意和深度，让人期待不已。希望你能继续保持创作的热情和耐心，不断探索自己的内心世界，用文字去表达你的思想和情感。或许在下一篇博客中，可以分享一些生活中的小故事或者观点，让读者更加了解你。加油！期待你更多精彩的作品！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。