机器学习(Machine Learning)与深度学习(Deep Learning)资料 之 数据集

以下内容摘选自:https://github.com/ty4z2008/Qix/blob/master/dl2.md
                          https://github.com/ty4z2008/Qix/blob/master/dl.md

介绍:Fuel为你的机器学习模型提供数据。他有一个共享如MNIST, CIFAR-10 (图片数据集), Google’s One Billion Words (文字)这类数据集的接口。你使用他来通过很多种的方式来替代自己的数据。

  • Datasets Used For Benchmarking Deep Learning Algorithms

介绍:deeplearning.net整理的深度学习数据集列表.

介绍:【语料库】语料库资源汇总

介绍:当前加州大学欧文分校为机器学习社区维护着306个数据集。查询数据集

  • Awesome Public Datasets

介绍:开放数据集.

  • A large-scale dataset of manually annotated audio events

介绍:Google发布大规模音频数据集

  • Yet Another Computer Vision Index To Datasets (YACVID)

介绍:计算机视觉的一个较大的数据集索引, 包含387个标签,共收录了314个数据集合,点击标签云就可以找到自己需要的库了.

介绍:计算机视觉数据集不完全汇总

  • Citation Network Dataset

介绍:AMiner论文引用数据集(v7:2,244,021 papers and 4,354,534citation relationships)


介绍:雅虎研究院的数据集汇总:包括语言类数据,图与社交类数据,评分与分类数据,计算广告学数据,图像数据,竞赛数据,以及系统类的数据。

  • Awesome Public Datasets

介绍: Awesome系列中的公开数据集

  • Evaluating language identification performance

介绍:如何在社会媒体上做语言检测?没有数据怎么办?推特官方公布了一个十分难得的数据集:12万标注过的Tweets,有70种语言

  • WikiTableQuestions: a Complex Real-World Question Understanding Dataset

介绍:WikiTableQuestions——复杂真实问答数据集

  • Big Data: 35 Brilliant And Free Data Sources For 2016

介绍:(2016)35个超棒的免费大数据源

  • Datasets for Natural Language Processing

介绍:自然语言处理NLP数据集列表

  • Microsoft Academic Graph

介绍:37G的微软学术图谱数据集.

  • 6 Useful Databases to Dig for Data (and 100 more)

介绍:适合做数据挖掘的6个经典数据集(及另外100个列表).

  • Large-scale CelebFaces Attributes (CelebA) Dataset

介绍:香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集: Large-scale CelebFaces Attributes(CelebA) Dataset 10K 名人,202K脸部图像,每个图像40余标注属性.

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值