大模型实战营Day4 XTuner 大模型单卡低成本微调实战

AIzealot无

已于 2024-01-13 20:41:28 修改

阅读量559

点赞数 7

分类专栏：跟无神学AI 文章标签： AIGC 人工智能语言模型

于 2024-01-13 20:28:47 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72806612/article/details/135574724

版权

跟无神学AI 专栏收录该内容

43 篇文章 2 订阅

订阅专栏

本文介绍了算法专家的课程，涵盖微调技术如知识库建立、微调方法（包括指令微调和增量微调）、LoRA原理以及Xtuner提供的微调框架，讨论了GPU和显存使用优化。课程目标是教授AI领域的前沿知识和资源管理策略。

摘要由CSDN通过智能技术生成

本次讲师是一位从事算法工作的优秀贡献者。

一起来看看吧！

本次课程内容主要有：

我将在此整理前三节的内容，第四节放在作业章节进行讲解：

同第三节的建立数据库中所提及到的，如果通用大模型在专用领域表现能力不强，如何改进——

建立知识库或者微调，本节课进行的则是微调。

构建角色和对话模板，这项工作由Xtuner做过了，可以借此一键完成。

在预测阶段，这个不同角色模型的对话模板，两种模型的格式有所区别：

指令微调采用一问一答的方式进行：

下面还有增量微调：

其训练的数据是陈述句，然后将前两个角色内容留空，仍然是计算Assiant部分的损失。

LoRA的原理是在线性层平行增加一个两个小层的分支，因而能够减少训练的耗费。

有三种微调的方式，后二者是Xtuner提供的：

第三者在显存和GPU之间进行了一个整合，如果GPU满会到显存里面跑，速度会慢一些。

Xtuner为书生浦语提供的微调框架:

其能支持的模型的硬件资源比较广泛

并且在不同的卡上能够减少资源消耗：

今天的课程就到此为止，觉得有用的话点赞收藏加关注哦！

欢迎关注无神，一起学大模型和AI方面的前沿知识！

关注

7
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。