目录
登录
首先登录百度智能云:百度智能云控制台
在正式使用之前,应该会让你认证,跟着它的引导认证即可
准备训练集
在左边的侧边栏中点击数据集->通用数据集。然后点击创建数据集按钮,
然后根据自身情况填写对应信息。对象存储BOS应该要花钱,这里建议用平台共享存储
导入本地训练集(我推荐用xlsx或cvs格式,因为改内容会比较简单,就是调整一下字段就行,如果用jsonl,它的内容跟一般的json不太一样,改起来非常麻烦,别问我怎么知道的。注意,导入之前先参考对应的模板,然后根据模板调整训练集的内容即可):
上传后,点击确定即可:
然后系统就会开始导入:
如果导入失败,说明你的训练集有问题,再仔细对比一下模板进行调整即可。
导入完成后,要想在之后微调大模型时可以用这个训练集,还需要点击发布按钮:
当发布状态变为已发布时,就可以去微调大模型了:
微调大模型
点击模型精调->SFT,然后点击创建训练作业按钮。
也是根据自己情况填写下内容:
训练配置也可以根据自己的情况调整:
数据配置中,就可以选择刚才发布的训练集(其他选项默认即可,或根据自身情况调整):
闲时调度建议不要打开,我试了好几次(因为打开这个后,显示免费),如果把这个打开,之后微调会显示运行失败。自动发布可根据自身情况选择是否开启
然后就可以点击确定(如果余额为0,建议去充个5元试试水,不然之后可能会显示运行失败):
然后就可以看该微调作业的一下信息了(这里我就没有展示前面的案例了,而用的另一个已经在执行的任务,毕竟应该还是比较消耗money的,我也不想产生额外的money消费):