书生·浦语大模型实战营第二期第四课截图

hemaerika

已于 2024-06-14 00:38:57 修改

阅读量197

点赞数 2

文章标签： python 语言模型

于 2024-06-11 23:01:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hemaerika/article/details/139610555

版权

第四课xtuner微调

1、准备工作

我们首先是在 GitHub 上克隆了 XTuner 的源码，并把相关的配套库也通过 pip 的方式进行了安装。

然后我们根据自己想要做的事情，利用脚本准备好了一份关于调教模型认识自己身份弟位的数据集。

再然后我们根据自己的显存及任务情况确定了使用 InternLM2-chat-1.8B 这个模型，并且将其复制到我们的文件夹里。

最后我们在 XTuner 已有的配置文件中，根据微调方法、数据集和模型挑选出最合适的配置文件并复制到我们新建的文件夹中。

2、微调了常规训练300轮就出现了过拟合的现象，第600轮的时候已经出现严重的过拟合：

3、转换为huggingface文件后严重过拟合，回复的话就只有 “我是帆帆大佬的小助手，内在是上海AI实验室书生·浦语的1.8B大模型哦” 这句话

4、没有进行微调前，原模型是能够输出有逻辑的回复，并且也不会认为他是我特有的小助手。因此可以很明显的看出两者之间的差异性。

5、Web demo 部署

除了在终端中对模型进行测试，我们其实还可以在网页端的 demo 进行对话

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
书生·浦语大模型实战营第二期第四课截图

转换为huggingface文件后严重过拟合，回复的话就只有 “我是帆帆大佬的小助手，内在是上海AI实验室书生·浦语的1.8B大模型哦” 这句话。没有进行微调前，原模型是能够输出有逻辑的回复，并且也不会认为他是我特有的小助手。因此可以很明显的看出两者之间的差异性。第四课xtuner微调。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。