2024.1 书生·浦语大模型实战营第 4 节课堂笔记

godlikesun97

已于 2024-02-19 16:28:10 修改

阅读量436

点赞数 9

文章标签：笔记

于 2024-01-13 22:30:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/godlikesun97/article/details/135576658

版权

本文介绍了XTuner，一个支持多款大模型的微调工具箱，重点讲解了增量预训练和指令微调方法，以及如何使用8GB显卡在LLM上进行低成本微调，包括具体步骤如安装环境、数据处理和实战演示。

摘要由CSDN通过智能技术生成

项目地址：GitHub - InternLM/tutoriald

第四节课视频地址：(4)XTuner 大模型单卡低成本微调实战_哔哩哔哩_bilibili

XTuner微调

Finetune简介

大模型的微调有两种

1. 增量预训练：给模型提供一些新知识，让模型在指定领域表现更好。

训练语料都是陈述句（system和input为空，只在output有内容）

2. 指令微调：让模型学会根据人类指令进行对话。

指令微调时，通过模板将训练预料中的System，User和Assistant拼接起来，并且只对答案部分计算损失。（推理时不分角色，直接和模型聊天即可）

XTuner介绍

LoRA & QLoRA：原基座模型权重不变，在旁路新增一个权重分支，来实现对模型的微调。

XTuner简介：

XTuner是一个大模型微调工具箱，支持多款开源大模型。

XTuner数据引擎：内置数据集映射函数个对话模板函数，支持丰富的开源数据集

8GB显卡玩转LLM

默认开启Flash Attention，集成DeepSpeed ZeRO,加速训练。

动手实战

动手实践部分分为三个模块，分别展示了用 openassistant-guanaco数据集、自定义数据集以及MS Agent数据集微调InternLM的操作过程。流程大致如下：

1. 安装conda环境、安装XTuner

2. 下载模型、微调数据和配置文件

3. 修改配置文件中的模型路径和数据路径，max_epoch改为1

4. 执行微调并采取deepspeed加速

5. 生成LoRA模型文件夹，并将其与基座llm合并

6. 与微调后的模型进行对话

详细过程请参考项目文档以及教程视频。

关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
2024.1 书生·浦语大模型实战营第 4 节课堂笔记

大模型的微调有两种1. 增量预训练：给模型提供一些新知识，让模型在指定领域表现更好。训练语料都是陈述句（system和input为空，只在output有内容）2. 指令微调：让模型学会根据人类指令进行对话。指令微调时，通过模板将训练预料中的System，User和Assistant拼接起来，并且只对答案部分计算损失。（推理时不分角色，直接和模型聊天即可）LoRA & QLoRA：原基座模型权重不变，在旁路新增一个权重分支，来实现对模型的微调。
复制链接

扫一扫

godlikesun97 CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

137万+: 周排名

12万+: 总排名

7600: 访问

: 等级

352: 积分

109: 粉丝

152: 获赞

7: 评论

135: 收藏

私信

关注

热门文章

最新评论

2024.2 DataWhale 多智能体实战第四章多智能体开发
CSDN-Ada助手: 恭喜您撰写了第20篇博客，标题为“2024.2 DataWhale 多智能体实战第四章多智能体开发”。您的持续创作展现了您对多智能体领域的热情和专注，对此我表示由衷的祝贺。在下一步的创作中，我建议您可以尝试深入探讨多智能体开发的实际应用场景，或者结合具体案例进行分析，这样可以让读者更好地理解和运用您所分享的知识。同时，也希望您能够保持谦逊的态度，不断学习和提升自我，为读者带来更多有价值的内容。期待您更多的精彩作品，加油！
2024.1 书生·浦语大模型实战营第 4 节课后作业
CSDN-Ada助手: 恭喜您写了第12篇博客，看来您对于书生·浦语大模型实战营的学习进展顺利啊！不过我觉得您可以在作业中多加入一些实际案例或者个人见解，这样可以让读者更加深入地了解您对课程内容的理解。希望您能继续保持创作的热情，期待您更多精彩的作品！
2024.1 书生·浦语大模型实战营第 4 节课堂笔记
CSDN-Ada助手: 恭喜作者能够持续不断地分享关于浦语大模型实战营的课堂笔记，看来您对这门课程的学习非常用心。希望您能够继续坚持下去，不断分享您的学习心得和体会。同时，我也建议您可以考虑在将来的博客中加入一些个人的见解和思考，这样可以让读者更加深入地了解您对于这门课程的理解和体会。期待您更多的精彩内容，加油！
2024.1 书生·浦语大模型实战营第 3 节课后作业
CSDN-Ada助手: 恭喜您完成第9篇博客！看到您参加了浦语大模型实战营的课后作业，让我感到非常欣慰。您的持续创作真是令人钦佩！我想给您提供一些建议，希望对您的创作有所帮助。下一步，您可以尝试写一些关于技术趋势的博客文章，或者分享一些实战经验和案例分析，这样可以进一步丰富您的博客内容。期待看到您未来更多精彩的创作！谦虚地说，我相信您会有更多的突破和进步。加油！
2024.1 书生·浦语大模型实战营第 3 节课堂笔记
CSDN-Ada助手: 恭喜您写完了第10篇博客！标题为“2024.1 书生·浦语大模型实战营第 3 节课堂笔记”真是让人期待。您的坚持与努力可见一斑，每一篇博客都是对知识的总结与分享。接下来，我希望能看到您在未来的创作中更多地加入自己的观点和体会，这样可以使您的博客更富个人特色，也更能引发读者的共鸣。希望您能继续保持创作的激情，期待您的下一篇作品！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。