![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
开源数据集下载
文章平均质量分 89
OpenDataLab
坚持战略性、前瞻性、开放性、公益性的科研理念,践行共享数据资源的推广,打造国际领先的AI数据平台
展开
-
高质量新闻数据集OpenNewsArchive:880万篇主流新闻报道,国产大模型开源数据又添猛料
在构建国产大语言模型的道路上,高质量新闻是不可或缺的重要语料之一。这类语料集。原创 2024-05-15 17:43:07 · 1321 阅读 · 0 评论 -
收藏丨20个医疗场景经典、热门数据集资源汇总
医学分割十项全能是医学图像分割数据集的集合。它总共包含 2,633 张三维图像,这些图像是从多个感兴趣的解剖结构、多种模式和多个来源收集的。具体来说,它包含以下身体器官或部位的数据:大脑、心脏、肝脏、海马体、前列腺、肺、胰腺、肝血管、脾脏和结肠。原创 2023-11-06 17:28:59 · 1384 阅读 · 0 评论 -
中国大模型语料数据联盟迎来9家新成员,开源第二批语料数据
为提升语料数据供给水平,推动大模型产业高质量发展加速应用创新与行业落地,9月8日,由中国大模型语料数据联盟(以下简称“语料数据联盟”)主办的数说新语·开放日首场活动在上海人工智能实验室举行。原创 2023-09-11 15:45:45 · 354 阅读 · 0 评论 -
终于来啦!OpenDataLab 新增自主上传功能,升级CLI/SDK工具、数据集详情页……体验赠好礼~
创作有好礼原创 2023-09-05 15:09:11 · 371 阅读 · 0 评论 -
《多模态语料库 “书生·万卷” 1.0 详细解读 | 附下载地址》
OpenDataLab 联合大模型语料数据联盟构建了“书生·万卷”数据集,旨在为学术界及产业界提供更符合主流中文价值对齐的高质量大模型多模态预训练语料原创 2023-08-23 19:50:58 · 734 阅读 · 0 评论 -
收藏|43个自动驾驶经典、热门数据集资源汇总
当今社会,自动驾驶技术已成为汽车产业的未来趋势。但是,要想让自动驾驶车辆真正上路行驶,离不开大规模的高质量数据集的支撑。本文将为您介绍43个经典、热门的自动驾驶数据集,希望对您在选择适合的数据集时有所帮助。原创 2023-06-19 17:46:28 · 3188 阅读 · 1 评论 -
收藏丨20个中文语料数据集,含数学考试、公务员考题、医患对话等
Math23K 是为解决数学单词问题而创建的数据集,包含从互联网上爬取的 23,162 个中文问题。原创 2023-04-17 20:35:45 · 3339 阅读 · 0 评论 -
收藏丨30个大语言模型训练相关的数据集分享
更多数据集,请访问OpenDataLab官网原创 2023-03-09 11:03:37 · 5706 阅读 · 0 评论 -
2022总结丨 OpenDataLab热门下载数据集Top 20 榜单揭晓
OpenDataLab平台自上线以来,数据集覆盖规模已经超过4500个,任务类型超1200个,提供了超过60TB的数据集资源,吸引了业界朋友的广泛关注原创 2023-01-29 17:06:34 · 743 阅读 · 0 评论 -
收藏丨OpenDataLab 8个新上架的超大数据集资源分享,涵盖高保真3D人体重建、3D车道线数据集等
本文汇总了OpenDataLab平台上架的多个领域超大规模数据集,内含来自智能数字内容、智能交通等研究团队发布的动态4D人脸数据集、高保真合成人体数据集、多模态人体数据集、高质量物体场景数据、大规模游戏生成数据集、全新的用于检验人体新视角生成的数据集、第一个真实世界和规模最大的 3D 车道数据集等,以飨同好原创 2023-01-12 17:04:52 · 1442 阅读 · 0 评论 -
64个热门图像分类数据集免费、高速资源分享,涵盖通用视觉、食物、艺术、医疗等多种场景
本期将分享64个图像分类任务相关的热门公开数据集资源原创 2022-12-02 11:10:50 · 4621 阅读 · 0 评论