基于星火大模型的群聊对话分角色要素提取挑战赛
比赛链接:
https://challenge.xfyun.cn/topic/info?type=role-element-extraction&option=tjjg&ch=dw24_y0SCtd
关于#AI夏令营#Datawhale #夏令营【大模型技术】学习规划表
#Datawhale AI夏令营
Task1:跑通baseline
基于星火大模型的群聊对话分角色要素提取挑战-baseline
Task 2:调整baseline
1.赛事任务介绍
从给定的<客服>与<客户>的群聊对话中,提取出指定的字段信息,具体待提取的字段信息见下文。
(1)赛题要求:只支持星火大模型api与零代码微调。
(2)训练数据129条,测试数据55条
关于大模型的使用说明&限制。
• 如果使用大模型进行信息抽取, 本次仅限使用星火大模型。
• 为了排除人工校验、修正等作弊方式,本次比赛除了提交答案之外,排行榜前3名选手需要提供完整的源代码进行审核,要求抽取的结果必须可以准确复现。
• 注:排行榜前3名有审核不通过现象时,依次按得分顺延。满分36分,原则上最终入围决赛三甲得分不得低于20分。
• 允许使用大模型微调的方式进行信息抽取, 微调的基座模型仅限星火大模型。
2.工具准备
(1)电脑没安装3.8版本,只有3.6的。重新安装了一下
3.环境准备
4.数据处理
星火大模型或者微调的限制,需要将过长的文本进行截断。通常可以选择截断到一个合理的长度,例如可以根据模型输入的最大长度进行处理。