Datawhale AI夏令营 第四期 从零入门大模型微调 (持续更新中)

整体概述:

        基本按照教程一步一步进行(大家也可以到Datawhale (linklearner.com)进行查看哦),就可以成功运行并获得一定的分数,过程中可能会遇到一些小问题,可以在询问AI或者网上搜一下就可以解决,如有问题,可以下方留言,博主也很热心的哦。

个人体会:

        这是我第二次接触大模型相关知识,本次夏令营可以说,也相当于傻瓜式教程,只要大家一步一步跟着做,肯定能得到相应的分数,但是既然学了,那么就要有自己的思考。首先就是要对比赛的要求,以及如何提分要有自己的了解与思考,其次就是要了解相关大模型网站的具体用法,不只是下方教程内的一些功能,最后就是自行要多利用空余时间对模型进行测试。

        我个人理解的是,本次比赛首先考验的是大家对数据集的收集与扩充,数据集内的内容丰富,训练出来的模型就越好,其次就是大家对中文/英文prompt的改写,大家可以尝试不同的提示词,会得到不同的分数。

        需要注意的是,相同的数据集和prompt可能得到不同的分数,这是因为比赛进行测试的数据是随机的,到后面的复赛、决赛是人工,这里大家不用太担心,主要还是上面我个人总结的两点,希望大家可以取得自己想要的分数哦!

        总体来说,此夏令营可以说是“师傅领进门,修行靠个人”,只有自学能力有了,才能一步一个脚印成长,祝大家成为更好的自己哦。

下面是博主自己详细的操作过程:

day1

一、进行赛事报名

赛事链接:2024 iFLYTEK AI开发者大赛-讯飞开放平台

这里就省略了注册登录的步骤了(正常注册登录就可以)

然后点击“报名参赛”

注意:报名的时候需要先完成实名认证。

在“我的资料”里面进行“实名认证”

二、运行baseline,进行数据处理

链接:星火大模型驱动阅读理解题库构建挑战赛baseline - 飞桨AI Studio星河社区

  1. 进行注册登录(这里支持微信等多方面登录,博主用的是微信登录)

     2、直接点击右上角的“运行一下”

使用基础版的就可以,然后点击进入

注意:如果是新用户,需要完善信息(省略,正常填写即可)

3、运行“main.ipynb”代码(点击“全部运行”)(大约3分钟左右),然后会生成一个output.jsonl文件,下载本文件即可(文件用于第三步微调)

三、进行模型微调

链接:大模型定制训练平台

这里需要上一个步骤的output.jsonl文件

点击右上角“新建数据集”

自行设计数据集名称,然后点击“创建并上传文件”

点击“本地上传”,上传output.jsonl文件,然后在“input”中选择input,在“target”中选择output,点击“确定”

此时,程序正在运行,等待大约2分钟,然后“去训练”按钮会变蓝,点击此按钮

之后自行设计“模型名称”,“基础模型”就选spark-13b,此训练需要收费(再完善信息的时候,系统给了很多优惠卷,在下方随便选择一个就可以,相当于此训练免费),点击提交

这里一般是30分钟左右,也可能时间更长,可以利用这点时间去了解一下这几个网站的其他用处,之后点击“发布为服务”(因为我已经发布过了,所以,这里显示的为“更新服务”)

这里注意的是,选择应用,大家可以到https://console.xfyun.cn/app/myapp创建一个。

这里自行选择即可

在“我的模型服务中”,记住下面五个参数(我已经将数据抹黑的那五个)

四、模型测试(回到notebook)

将上一步记住的五个参数填入即可(注意顺序别填错了  SPARKAI_APP_ID  SPARKAI_API_SECRET = ''  SPARKAI_API_KEY = ''  serviceld=  resourceld=

),然后点击左上角的小三角

之后生成结果代表运行成功

五、到比赛官网提交结果

链接:2024 iFLYTEK A.I.开发者大赛-讯飞开放平台

点击“提交结果”

然后在下方“资源id”就是上面五个参数中的resourceld

中文部分(此地方目前比赛,我们可以改的地方),大家可以尝试一下其他的中文/英文prompt

    (1)理解文中重要概念的含义

    (2)理解文中重要句子的含意

    (3)分析论点、论据和论证方法

英文部分

    (1)Understanding the main idea of the main idea.

    (2)Understand the specific information in the text.

    (3)infering the meaning of words and phrases from the context

之后点击提交

评分大概需要 1到2小时,评分结束后可以在【提交页面最下方】处看到评分结果哟!(预期分数在70分左右)

注意:一周内可以提交4次哦,大家利用好每一次机会

下面是博主本人的分数,比较低,大家加油哦,肯定比我高的,嘻嘻嘻嘻

day2

本次主要是对代码进行了精度,对代码精度这一板块,建议零基础小白先将python基础学好,然后将几个常用的库numpy、pandas等一些常用的库学明白后,再来对代码学习,这样会事半功倍,不然学的只会是一头雾水。

个人感觉比较麻烦的还是数据处理方面,有很多不规范的数据需要大家更改或者舍弃,比较废人。

教程链接:Datawhale (linklearner.com)

博主个人建议的python基础课程:【黑马程序员python教程,8天python从入门到精通,学python看这套就够了】https://www.bilibili.com/video/BV1qW4y1a7fU?p=154&vd_source=e616bbb2057a942b387524891be126b1

在提分的时候,大家可以改一下prompt,我python学的一般,就没有更改代码部分,大致看懂了代码是干什么的,然后自己改了一下prompt提交了上去,目前还在评分,等评完分,博主再更新哦。

更新喽,分数反而降低了,看来我的prompt还有待提高呀(哭死),大家加油!

  • 7
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值