Deep learning for Computer Vision with Python笔记(3)图像数据集介绍

上文链接:

第一、二章:​​​​​​​Deep learning for Computer Vision with Python 计算机视觉与深度学习阅读笔记(1)​​​​​​​

第三、四章:Deep learning for Computer Vision with Python 计算机视觉与深度学习阅读笔记(2)_冰淇淋2333的博客-CSDN博客

第五章 图像分类的数据集

在开始训练之前,我们要知道如何去创建一个数据集,并且构建图像分类器。我们首先将介绍书中将会用到的数据集。

5.1 MNIST

这是一个手写数据集,目的是为了识别手写的0~9。它通常用来作为基准数据库,用来对机器学习算法的表现进行排序。 它包含60000个训练数据和10000个测试数据,特征维度是784维,包含28✖️28像素的图片。这些像素是0~255范围内的整数(只有单通道的像素)。 

5.2 Animals:狗,猫和熊猫

这是一个包含猫,狗和熊猫的三类动物数据集,分别每个类包含1000张图片。这个数据集将在第十章使用卷积神经网络时进行使用。它常用于作为Kaggle 猫狗的样本,是入门的选择。

5.3 CIFAR-10

CIFAR-10和MNIST一样,是一种基准数据集,通常在图像分类中进行使用,它包括60000张32✖️32✖️3的图片,每个特征向量维度为3072.它包括十个类别:飞机,电动车,鸟,猫,鹿,狗,青蛙,马,轮船,火车。

这个数据集的分类难度更大了,由于包含的类别较多,很多情况可能发生重叠。

5.4 SMILES

SMLIES是由微笑和不微笑的人脸组合起来的。这个数据集仅用来识别微笑任务,所有图片都是紧密围绕着人脸剪裁。

5.5 Kaggle: Dogs vs Cats

这是Kaggle一个挑战用到的数据集,用来分辨猫和狗,这个任务中对图片的处理非常重要,这说明图片处理在深度学习任务中具有很大的帮助。

5.6 Flowers-17

这是一个花卉数据集,包括17类不同的花,用来识别不同种类的花卉。这是一个比较有挑战性的数据集,因为图片中不同的比例、视角、背景影响、不同的照明 和类内变化都讲造成困难。由于每类只有80个图片,因此深度学习在不过拟合(小型数据集)上学习每类的特征就具有一定的困难。一般来说,为了训练深度学习网络,建议每类有1000-5000个样本图像。

 

5.7 CALTECH-101

caltech-101是一种较为流行的目标检测的基准数据集,通常用来预测图像中特定对象边界框的x,y坐标。CALTECH-101的特点是,不同类别样本数非常不平衡,这有助于对不平衡类别数据集的研究

5.8 Tiny ImageNet 200

这是一个小型的图像分类数据集,包含200个图像类,其中500个图像用于训练,50个图像用于验证,50个用于测试,每幅图像都经过预处理为64×64×3的像素尺寸,这个数据集更注重深度学习技术的研究,而不是图片预处理。

5.9 Adience

这个数据集主要用于年龄和性别识别的研究,数据集包含26580张图像,主要用于构建年龄和性别的识别系统。​​​​​​​

5.10 ImageNet

ImageNet是一个项目,他的数据集中有超过1400万张图像,为了将这些图片进行标记和分类为22000个类别。这些类别由固定的单词、短语组成语法集,使用WordNet层次结构,每个语法集中有1000多个图像。

ImageNet大规模视觉识别挑战(ILSVRC)的目的是训练一个分类模型,将图像分成1000个单独的类别,使用120万图片进行训练,5000验证,100000测试,这些图像的完整列表位于:http://pyimg.co/x1ler.

ImageNet挑战是计算机视觉分类算法的标准,优秀的CNN算法和深度学习技术占据这个挑战的排行榜。ImageNet数据集上可以训练很多开创性的网络架构:AlexNet,SqueezeNet,VGGNet,GoogLeNet,ResNet。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值