深度学习(一):深度学习图像数据库详解

1. MNIST手写数字分类图像集

地址:http://yann.lecun.com/exdb/mnist/

手写数字识别图像库,共70000张图片,其中60000张训练集图片,10000张测试集图片,图像大小28x28,黑底白字样式

train-images-idx3-ubyte.gz:训练集图片

train-labels-idx1-ubyte.gz:训练集图片对应数字标签

t10k-images-idx3-ubyte.gz:测试集图片

t10k-labels-idx1-ubyte.gz:测试集图片对应数字标签

下载后需转为lmdb或leveldb格式

 

2. CIFAR分类图像集

CIFAR-10图像集包含60000张32x32的彩色图片,共分10个类别,每个类别6000张图片。其中50000张为训练集图片,10000张为测试集图片。训练集中每个类别5000张图片,测试集中每个类别1000张图片,训练集与测试集中图片类别均随机分布。

图片共10个类别,包括:飞机、小汽车(含轿车与SUV)、鸟、猫、鹿、狗、青蛙、马、船、卡车(仅含大卡车,不含皮卡)。

链接中有3个不同格式的版本可下载:

CIFAR-10 binary version (suitable for C programs)解压后如下所示,训练集图片分为5个包(batch),每个包都为bin后缀,每个包有10000张图片。测试集有1个包,包含10000张图片。训练集中可能有的包的类别中的图片数可能多于其他类别的,但总的来说,所有训练集中每个类别都是5000张图片。

CIFAR-100 包含60000张图片,共100个类别,每个类别600张图片。其中训练集50000张,每个类别500张。测试集10000张,每个类别100张。CIFAR-100的100个类别,又可分为20个大类(superclass),每张图片包含所属的精准类(即100个类别中的类),以及所属的大类的类别。分属的类别如下:

3. Pascal VOC 

Pascal VOC挑战赛是视觉对象分类识别与检测的一个基准测试,从2005年到2012年每年都举行一场图像识别的挑战赛。2012年后不再举办,但其数据质量好,标注完备,非常适合用来测试算法性能。较常用的Pascal VOC数据集有Pascal VOC2007与Pascal VOC2012。

Pascal VOC2007图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。总共9963张图片包含24640这个标注对象。

待续。。。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值