Deep learning for Computer Vision with Python笔记（3）图像数据集介绍

Hazelyu27

已于 2022-07-13 09:19:29 修改

阅读量1.4k

点赞数 9

分类专栏：计算机视觉文章标签：计算机视觉人工智能神经网络深度学习

于 2022-07-12 09:28:52 首次发布

本文链接：https://blog.csdn.net/weixin_44858585/article/details/125732765

版权

计算机视觉专栏收录该内容

7 篇文章 0 订阅

订阅专栏

上文链接：

第一、二章：Deep learning for Computer Vision with Python 计算机视觉与深度学习阅读笔记（1）

第三、四章：Deep learning for Computer Vision with Python 计算机视觉与深度学习阅读笔记（2）_冰淇淋2333的博客-CSDN博客

第五章图像分类的数据集

在开始训练之前，我们要知道如何去创建一个数据集，并且构建图像分类器。我们首先将介绍书中将会用到的数据集。

5.1 MNIST

这是一个手写数据集，目的是为了识别手写的0～9。它通常用来作为基准数据库，用来对机器学习算法的表现进行排序。它包含60000个训练数据和10000个测试数据，特征维度是784维，包含28✖️28像素的图片。这些像素是0～255范围内的整数（只有单通道的像素）。

5.2 Animals：狗，猫和熊猫

这是一个包含猫，狗和熊猫的三类动物数据集，分别每个类包含1000张图片。这个数据集将在第十章使用卷积神经网络时进行使用。它常用于作为Kaggle 猫狗的样本，是入门的选择。

5.3 CIFAR-10

CIFAR-10和MNIST一样，是一种基准数据集，通常在图像分类中进行使用，它包括60000张32✖️32✖️3的图片，每个特征向量维度为3072.它包括十个类别：飞机，电动车，鸟，猫，鹿，狗，青蛙，马，轮船，火车。

这个数据集的分类难度更大了，由于包含的类别较多，很多情况可能发生重叠。

5.4 SMILES

SMLIES是由微笑和不微笑的人脸组合起来的。这个数据集仅用来识别微笑任务，所有图片都是紧密围绕着人脸剪裁。

5.5 Kaggle： Dogs vs Cats

这是Kaggle一个挑战用到的数据集，用来分辨猫和狗，这个任务中对图片的处理非常重要，这说明图片处理在深度学习任务中具有很大的帮助。

5.6 Flowers-17

这是一个花卉数据集，包括17类不同的花，用来识别不同种类的花卉。这是一个比较有挑战性的数据集，因为图片中不同的比例、视角、背景影响、不同的照明和类内变化都讲造成困难。由于每类只有80个图片，因此深度学习在不过拟合（小型数据集）上学习每类的特征就具有一定的困难。一般来说，为了训练深度学习网络，建议每类有1000-5000个样本图像。