Datawhale AI 夏令营---第四期（从零入门大模型微调）（一）

蓝色的@猫

于 2024-08-10 09:41:48 发布

阅读量175

点赞数 2

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62706061/article/details/141086025

版权

Datawhale AI 夏令营---第四期（从零入门大模型微调）（一）

跑通baseline

基本任务：微调spark-13b模型，生成高考语文现代文阅读和英语阅读问题QA对
依托于下图所示比赛
在这里插入图片描述
https://challenge.xfyun.cn/topic/info?type=question-bank-construction&option=ssgy

跑通baseline

训练数据制作

根据教程，运行代码获得output.jsonl文件
在这里插入图片描述

由图可见，训练资料就是阅读理解题

模型微调

基于讯飞大模型定制训练平台
在这个平台上提交训练资料，然后进行微调训练
在这里插入图片描述
然后还要发布为服务，根据生成的resourceid等进行简单测试和最后提交。

提交

提交平台：http://challenge.xfyun.cn/topic/info?type=question-bank-construction&option=tjjg
我第一次训练了4个小时(lr: 6e-5， epoch:10)，最后得分42
第二次训练了1个小时(lr: 8e-5, epoch:15)，最后得分22.
在这里插入图片描述
训练时间很长，测试时间也超级长，分数很低。QAQ。菜。。。

最后，一步一步照着教程做即可，但是不知道具体怎么做微调，怎么调参数，希望之后的学习中学会。

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Datawhale AI 夏令营---第四期（从零入门大模型微调）（一）

datawhale ai夏令营第四期（从0入门LLM微调），小白文，task1
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。