5 月版本更新丨新上线200+权威数据集,可在线预览数据信息、实时反馈需求及问题

OpenDataLab公开数据集平台更新啦!欢迎大家前往官网体验:OpenDataLab

本次更新亮点如下。


01新增数据分布可视化

让你在线快速了解数据特征

为了提高数据集的查找效率,我们在数据集详情页,新增了“数据统计”模块。

用清晰的图表展示了数据集中数据类型、文件大小、标注情况、标签内容的分布情况。无需下载,即可在线快速地掌握该数据集的数据概况。

数据统计模块(图源:OpenDataLab数据集详情页)

02 新增问题反馈入口

实时接收、处理你的需求和建议

在数据集检索页面、数据集详情页面右下角,新增了“问题反馈”按钮。

如果你在产品使用过程中遇到了问题,或是迸发了好的想法和建议,或是有新增的数据集需求,都可以向我们反馈,我们会第一时间进行接收和处理。

问题反馈入口(图源:OpenDataLab数据集列表页)

03 新增200余个权威数据集

提供更丰富的下载资源

这一期,我们为大家提供了200多个新的、高质量的数据集资源,涵盖了通用模型、智慧文娱、智慧教育、智慧零售、智慧医疗等多个行业。

新增数据集分布

其中以NLP领域数据集为主,其数量超过90个。且这些数据集都来自剑桥大学、约翰霍普金斯大学、谷歌大脑等众多知名院校、科技实验室,相关论文都有着不错的引用量。比如:

TriviaQA 数据集

作为一个多轮推理的阅读理解数据集,TriviaQA包含了超过650K的问题-答案-证据三元组,包括了95K问答对,在规模上超出了之前阅读理解的主流数据集。

RACE 数据集

RACE数据集来自于中国学生的初高中的英语考试中,是目前使用最广泛的大规模选择型阅读理解数据集之一,其中包含了大约 28000 个文章以及近 100000 个问题。


NSynth 数据集

谷歌NSynth数据集,收录了从1000种乐器中采集的大量注释的音符,包括不同的音高和速率,比同类的公共数据集大了一个数量级。

……

这么丰富的数据集资源,小伙伴们不用再担心”无粮下锅“啦。更多AI 数据集资源、资讯,尽在OpenDataLab,等你来探索~

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值