神经网络与深度学习
常用数据集总结
MNIST数据集
MNIST数据集是由0~9手写数字图片和数字标签所组成,有60000个训练样本和10000个测试样本组成,每个样本都是一张28*28像素的灰度手写数字图片。
Fashion-MNIST数据集
FashionMNIST是一个替代MNIST手写数据集的图像数据集。它是由Zalando旗下的研究部门提供,涵盖了来自10种类别的共7万个不同商品的正面图象。FashionMNIST的大小、格式和训练集、测试集划分与原始MNIST完全一致。
CIFAR-10数据集
CIFAR-10数据集由10个类的60000个32×32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。
PASCAL VOC数据集
PASCAL的全称是Pattern Analysis,Statistical Modelling and Computational Learning
VOC的全称是Visual Object Classes
目标分类(识别)、监测、分割最常用的数据集之一
一共分成20类:
- person
- bird, cat, cow, dog, horse, sheep
- aeroplane, bicycle, boat, bus, car, motorbike, train
- bottle, chair, dining, table, potted plant, sofa, tv/monitor
MS COCO数据集
MS COCO的全称Miscrosoft Common Objects in Context,起源于微软2014年出资标注的Miscrosoft COCO数据集。数据集以scene understanding 为目标,主要从复杂的日常场景中截取。包含目标分类(识别)、检测、分割、语义标注等数据集。
MS COCO提供的标注类别有80类,有超过33万张图片,其中20万张有标注,整个数据集中个体的数目超过150万个。
ImageNet数据集
始于2009年,李飞飞与Google合作:
“ImageNet: A Large-Scale Hierarchial Image Database"
总图像数据:14,197,122
总类别数:21841
带有标记框的图象数:1,034,908
ISLVRC 2012数据集
ISLVRC 2012子数据集
训练集:1,281,167张图片+标签
类别数:1000
验证集:50,000张图片+标签
测试集:100,000张图片