共建AI开源数据集,OpenLabel数据标注共享平台招募志愿者

智源研究院推出OpenLabel数据飞轮项目,旨在解决大模型构建中的数据难题,打造开源数据平台,促进数据共享。平台首阶段聚焦中文语言模型的微调Instruct任务数据,将于4月15日预发布首个开源数据集。志愿者可通过贡献数据参与,优秀贡献者将获得奖励。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目前以 ChatGPT 为代表的大模型引起了学术界和工业界的广泛关注,构建大模型往往需要海量数据、大量算力和创新算法,其中数据是构建大模型必不可少的资源。然而,高质量数据集的建设成本高昂,此外很多数据由不同的机构构建,存储分散,而且由于商业竞争等原因,数据上形成了各自为战的局面,大家无法将分散的数据整合到一起发挥更大的作用。

基于以上背景,智源研究院发起了公益项目“OpenLabel数据飞轮”,旨在克服大模型创新中的数据难题,打造一个开源数据平台,汇聚多方力量,打破数据壁垒,推动中国大模型创新进程。人人贡献共享,不啻微芒,造炬成阳!

0664b90dff6f519a8cf164822c2fa25e.png

OpenLabel 数据共享标注平台已经发布(openlabel.baai.ac.cn),第一阶段主要关注中文语言模型中的微调 Instruct 任务数据,在 ChatGPT 的大潮下,这部分高质量、分布性广的数据是最为缺乏的。第一个开源数据集将在4月15日预发布,5月1日正式发布,期待大家一起共建共享!

即刻报名加入志愿者行列吧!小助手实测 1 分钟贡献 1~2 条,大家每天抽 10 分钟就可以成为AI开源数据集贡献者啦。

扫码报名成为志愿者👇

0ea8ad6ac95eabc777d7756a8f4ea3e2.png

快速进入官网贡献数据👇

https://openlabel.baai.ac.cn/(建议电脑端打开)

贡献者激励

我们将根据大家贡献的数量&质量评优发放奖励,表现优异者可获得 OpenLabel 优秀贡献者荣誉证书、智源大会线下坐席&专家交流机会、智源纪念T恤等。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值