【TensorFlow】TensorFlow从浅入深系列之九 -- 教你认识图像识别中经典数据集

本文是《TensorFlow从浅入深》系列之第9篇

TensorFlow从浅入深系列之一 -- 教你如何设置学习率(指数衰减法)

TensorFlow从浅入深系列之二 -- 教你通过思维导图深度理解深层神经网络

TensorFlow从浅入深系列之三 -- 教你如何对MNIST手写识别

TensorFlow从浅入深系列之四 -- 教你深入理解过拟合问题(正则化)

TensorFlow从浅入深系列之五 -- 教你详解滑动平均模型

TensorFlow从浅入深系列之六 -- 教你深入理解经典损失函数(交叉熵、均方误差)

TensorFlow从浅入深系列之七 -- 教你使用验证数据集判断模型效果

TensorFlow从浅入深系列之八 -- 教你学会变量管理

1、CIFAR数据集

CIFAR是一个影响力很大的图像分类数据集,CIFAR数据集中的图片为32*32的彩色图片,由Alex  Krizhevsky教授、Vinod Nair博士和Geoffrey Hinton教授整理的。

CIFAR是图像词典项目(Visual Dictionary)中800万张图片的一个子集。CIFAR数据集分为CIFAR-10CIFAR-100两个问题。

CIFAR-10问题收集了10个不同种类的60000张图片,每张图片仅包含一个种类的实体,每个类有6000个图像。有50000个训练图像和10000个测试图像。训练图像分为5个训练批次,每个批次包含100000万图像。下图显示了CIFAR-10数据集中的每一个种类的一些样例图片以及这些种类的类别名称。CIFAR官网https: //www.cs.toronto.edu/~kriz/cifar.html提供不同格式的CIFAR数据集下载。
 

CIFAR-100收集了100个类,每个类包含600个图像。每类各有500个训练图像和100个测试图像。CIFAR-100中的100个类被分成20个超类。每个图像都有一个所属类的名称所属超类的名称


2、ImageNet数据集

ImageNet数据集是由斯坦福大学李飞飞教授带头整理的数据集。

ImageNet是基于WordNet的大型图像数据库。将近1500万图片被关联到了WordNet的大约20000个名词同义词集上。每一个与ImageNet相关的WordNet同义词集都代表了现实世界中的一个实体,是分类问题中的一个类别。ImageNet中的图片是从互联网上爬取下来的,并且通过亚马逊的人工标注服务将图片分类到WordNet的同义词集上。

ImageNet的每一个图片可能会包含多个实体,这是和CIFAR数据集的区别,下图展示了ImageNet中的一张图片,图片中用几个矩形框出了不同实体的轮廓,在图像识别问题中,一般将用于框出实体的矩形成为bounding box。

ImageNet2012目前是使用比较多的数据集,包含了1000个类别的120万张图片,每张图片只属于一个类别

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值