Tensorflow笔记之图像识别常用数据集简介

1 图像识别问题简介及经典数据集

  视觉是人类认识世界非常重要的一种知觉。对于计算机来说,让计算机识别图片中的内容是很困难的。常用的经典数据集如下:

MNIST手写体识别数据集是一个相对简单的数据集,在其他更加复杂的图像识别处理集上,卷积神经网络有更加突出的表现。CIFAR数据集就是一个影响力很大的图像分类数据集。CIFAR数据集分为CIFAR-10和CIFAR-100两个问题,他们都是图像词典项目(Visual-Dictionary)中800万张图片中的一个子集。CIFAR数据集中的图片为32X32的彩色图片。

CIFAR-10问题收集了来自10个不同种类的60000张图片。相比真实环境的图像识别问题,有2个最大的问题:第一,现实生活中的图片分辨率要远高于32x32,其图像的分辨率也不会是固定的。第二;现实生活中的物体种类特别多,无论是10种还是100种都远远不够,且一张图片不会只出现一类物体,为了更加贴近实际,产生了ImageNet数据集。

  ImageNet是一个基于WordNet的大型图像数据库。在ImageNet中,将近1500万张图片被关联到了WordNet的大约20000个名词同义词集上。目前每一个与ImageNet相关的WordNet同义词集都代表了现实世界中的一个实体,可以被认为是分类问题的一个类别。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值