微调大模型（pytorch)

最新推荐文章于 2024-08-17 23:02:41 发布

lbxx1233

最新推荐文章于 2024-08-17 23:02:41 发布

阅读量468

点赞数 7

文章标签： pytorch 人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lbxx1233/article/details/140664628

版权

一.准备工作

配置

微调大模型首先要一个很好的显卡可以去AutoDLhttps://www.autodl.com/login去租一个4090

连接主机

个人喜欢用vscode去连接

下载ssh扩展

然后ctrl+shift+p输入ssh连接（主机开机后会有ssh连接复制就行了）

输入密码等待连接

在github里下载想要调试的大模型

搜索模型名称然后复制链接就行

在vscode终端输入

git clone

加链接

把文件下载到主机的文件里（一般在/root/下以模型名命名的文件）

然后再运行里面的python文件,一般是cli_demo.py（这里可能要下一次python扩展下载一下就行)

然后看报错看哪些库没有 pip install 库名下载一下

最后运行

这个运行大概率会报错

下载另一个预训练模型

https://www.modelscope.cn/models?name=GLM-4&page=1

在魔塔社区下载要用的模型，搜索一下，然后找到要用的模型（最好5-9B）

然后

点击下载模型；建议使用sdk下载复制里面的py代码

在vscode里新建一个python文件然后运行（注意要先保存后运行）

下载过后，此文件应该在/root/.modelscope里，复制新模型的地址，在cli_demo.py的path路径替换并运行。

到这里，已经完成了对基础大模型的训练

二。微调大模型

首先，需要

git clone https://github.com/hiyouga/LLaMA-Factory

下载LLaMa

下载之后，打开这个文件

cd LLaMA-Factory/,运行

pip install -r requirements.txt

这个文件里有好多库，下载一下。

之后打开src，运行webui.py，这是前端页面文件。

运行结果是这样的

再打开code，打开data，dataset.info.json文件

复制第一行，然后把identity改了，file_name改为自己的json文件(要把自己的json文件导入data文件夹下，复制粘贴就行），json文件的格式什么的网上都有，这里不赘述。

之后需要填型号名称，模型路径就是在vscode里的modelscope的预训练模型的路径。

数据集填改了的id，其他的不用管，然后把下面的4个选项一次点一遍。

这里会报错：

在终端输入

运行就好。

等微调之后，点入聊天页面，填入检查点路径，荷载模型就完成了

关注

7
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
微调大模型（pytorch)

复制第一行，然后把identity改了，file_name改为自己的json文件(要把自己的json文件导入data文件夹下，复制粘贴就行），json文件的格式什么的网上都有，这里不赘述。下载过后，此文件应该在/root/.modelscope里，复制新模型的地址，在cli_demo.py的path路径替换并运行。之后需要填型号名称，模型路径就是在vscode里的modelscope的预训练模型的路径。在魔塔社区下载要用的模型，搜索一下，然后找到要用的模型（最好5-9B）这个文件里有好多库，下载一下。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。