MNIST
创建人:
Yann LeCun, Courant Institute, NYU
Corinna Cortes, Google Labs, New York
Christopher J.C. Burges, Microsoft Research, Redmond
类型:手写数字数据库,深度学习入门级经典数据集
数据量:60000,含10000条测试
网站:http://yann.lecun.com/exdb/mnist/
cifar10/cifar100
创建人:Alex Krizhevsky,Ilya Sutskever(Hinton的两位弟子)
类型:普适物体识别的数据集
数据量:CIFAR-10数据集包含60000个32*32的彩色图像,共有10类。有50000个训练图像和10000个测试图像。CIFAR100则包括了100个类。
网站:http://www.cs.toronto.edu/~kriz/cifar.html
ImageNet
创建人:FeiFei Li
类型:目前世界上图像识别最大的数据库
数据量:千万级
网站:http://www.image-net.org/
YouTube-8M
创建人:Google
类型:大型视频数据集
数据量: 800 万个 YouTube 视频的 URL,代表 50 万小时长度的视频,并带有视频标注。这些标注来自一个多样化的、包含了 4800 个知识图谱实体(Knowledge Graph entity)的集合。
网站:https://research.google.com/youtube8m/explore.html
UCI数据集
创建人:加州大学欧文分校(University of California Irvine)
类型:提出的用于机器学习的数据库
数据量:共有几百个数据集,其数目还在不断增加
网站:http://archive.ics.uci.edu/ml/