书生浦语大模型实战营第四次课笔记

睡觉爱数羊

已于 2024-01-22 21:25:46 修改

阅读量1.1k

点赞数 24

分类专栏：书生浦语大模型实战营文章标签：笔记人工智能自然语言处理 python

于 2024-01-14 15:01:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40831032/article/details/135538834

版权

书生浦语大模型实战营专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1.简介

1.1 XTuner简介

xtunner 是一个大语言模型微调工具箱，它提供了各种功能来帮助用户快速、轻松地微调大语言模型。这些功能包括：

数据预处理： xtunner 提供了一系列数据预处理工具，可以帮助用户将数据转换为适合大语言模型训练的格式。这些工具包括分词、词干提取、停用词去除等。
模型选择： xtunner 提供了多种预训练的大语言模型供用户选择，包括 BERT、GPT-3、T5 等。用户还可以根据自己的需求选择不同的模型架构和参数。
微调任务： xtunner 支持多种微调任务，包括文本分类、文本生成、机器翻译、问答等。用户可以根据自己的需求选择不同的微调任务。
微调过程： xtunner 提供了一个直观、易用的微调过程，用户可以轻松地调整模型的超参数、训练数据和训练时间等。
模型评估： xtunner 提供了多种模型评估指标，可以帮助用户评估模型的性能。这些指标包括准确率、召回率、F1 分数等。
模型部署： xtunner 提供了一系列模型部署工具，可以帮助用户将微调好的模型部署到生产环境中。这些工具包括模型导出、模型压缩等。

xtunner 的主要优点包括：

易用性： xtunner 提供了一个直观、易用的界面，即使是没有任何机器学习经验的用户也可以轻松地使用它来微调大语言模型。
灵活性： xtunner 支持多种预训练的大语言模型、微调任务和模型评估指标，用户可以根据自己的需求选择不同的配置。
可扩展性： xtunner 可以轻松地扩展到大型数据集和复杂的微调任务上，用户可以利用它来微调大规模的大语言模型。

1.2 Fintune简介

示例：

1.3 指令跟随微调

1.4 增量预训练微调

1.6 LoRA & QLoRA

1.7 Xtuner

2. demo

2.1 安装XTuner

2.2 准备数据集和配置文件

OASST1数据集

OpenAssistant Conversations（OASST1），这是一个人工生成的、人工注释的辅助风格对话语料库，由35种不同语言的161443条消息组成，注释了461292个质量评级，产生了超过10000个完全注释的对话树。该语料库是涉及13500多名志愿者的全球众包活动的产物。

根据教程直接复制即可

2.3 开始训练

2.4 将得到的 PTH 模型转换为 HuggingFace 模型，即：生成 Adapter 文件夹

2.5 将 HuggingFace adapter 合并到大语言模型

有一个error，不知道有没有影响

demo: 略

2.6 自定义微调

以 Medication QA 数据集为例

基于 InternLM-chat-7B 模型，用 MedQA 数据集进行微调，将其往医学问答领域对齐。

2.6.1 训练

2.6.2 将得到的 PTH 模型转换为 HuggingFace 模型

修改为自己的配置文件和模型：

2.6.3 将 HuggingFace adapter 合并到大语言模型

2.6.4 测试

微调后：

无微调：

竟然没有任何区别，不知道为啥，可能是训练还没收敛？

睡觉爱数羊

关注

24
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
书生浦语大模型实战营第四次课笔记

以数据集为例基于 InternLM-chat-7B 模型，用 MedQA 数据集进行微调，将其往医学问答领域对齐。
复制链接

扫一扫

专栏目录

睡觉爱数羊 CSDN认证博客专家 CSDN认证企业博客

码龄7年

15: 原创

48万+: 周排名

9万+: 总排名

9857: 访问

: 等级

356: 积分

122: 粉丝

186: 获赞

3: 评论

172: 收藏

私信

关注

分类专栏

最新评论

A Survey for Foundation Models in Autonomous Driving（翻译）
CSDN-Ada助手: 恭喜您撰写第15篇博客！阅读您的文章《A Survey for Foundation Models in Autonomous Driving》，对基于自动驾驶的基础模型进行调查是非常有意义的。建议您在下一篇博客中可以深入探讨某个具体的基础模型，比如深入分析其应用场景、优缺点以及未来发展趋势，这样可以为读者提供更多深入的信息。期待您的下一篇作品！
Lagent调用mmdetection api
CSDN-Ada助手: 恭喜你写了第11篇博客，标题看起来很有技术含量！希望你能继续坚持创作，分享更多关于Lagent调用mmdetection api的经验和心得。下一步，或许你可以考虑分享一些实际案例或者问题解决的经验，让更多人受益。加油！
书生浦语大模型实战营第四次课作业-使用XTuner 微调 InternLM-Chat-7B 模型
CSDN-Ada助手: 恭喜作者在书生浦语大模型实战营中取得了进展，并成功完成了第四次课的作业！使用XTuner微调InternLM-Chat-7B模型的经验和分享对于我们这些刚入门的读者来说是非常宝贵的。希望作者在未来的创作中能够继续分享自己在模型调优和实战应用方面的心得体会，也可以考虑增加一些实际案例分析，让读者更好地理解模型的应用场景和效果评估。加油！期待作者更多精彩的分享！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
书生浦语大模型实战营第四次课笔记
CSDN-Ada助手: 恭喜您继续分享关于“书生浦语大模型实战营”的学习心得，这些课程笔记对于正在学习或者准备学习的读者们都会有很大的帮助。接下来，建议您可以尝试加入一些个人的思考和总结，让读者更容易理解您对课程内容的理解和应用。期待您的下一篇分享！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
书生浦语大模型实战营第三次课笔记
CSDN-Ada助手: 恭喜你开始了博客创作！看到你分享了“书生浦语大模型实战营第三次课笔记”，内容详实且有条理。希望你能继续坚持下去，不断提升自己的写作水平，多多参与交流讨论，拓展自己的视野，也可以多尝试一些不同类型的文章，让读者有更多的选择。加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。