图片数据集介绍

最新推荐文章于 2024-07-05 18:01:31 发布

我与懒惰作斗争的日子

最新推荐文章于 2024-07-05 18:01:31 发布

阅读量3k

点赞数

本文链接：https://blog.csdn.net/qq_39437730/article/details/118281017

版权

文章目录

1、写在前面
2、数据集Caltech101介绍
3、数据集Caltech256介绍
4、数据集CelebA介绍
5、数据集CIFAR10介绍
6、数据集CIFAR100介绍
7、数据集Cityspaces介绍
- 7.1 Cityscapes数据集的特点
- 7.2 Cityscapes数据集的目的
8、数据集CocoCaptions介绍
9、数据集CocoDetection介绍
10、数据集DatasetFolder介绍
11、数据集EMNIST介绍
12、数据集FakeData介绍
13、数据集FashionMNIST介绍

1、写在前面

介绍深度学习中的数据集

2、数据集Caltech101介绍

来源：加利福尼亚理工学院101类图像数据库
数据集目的：
项目地址：
下载地址：

3、数据集Caltech256介绍

来源：Caltech 256数据集是加利福尼亚理工学院收集整理的数据集。

简要介绍：该数据集选自google image数据集，并手工去除了不符合其类别的图片。在该数据集中，图片被分为256类，每个类别的图片超过80张。Caltech 256数据集是 caltech-101 数据集的改进版图片数据集，该数据集收集了 256 个类的 20607 张图片。

有几处改进：
a）类别数量增加一倍以上
b）任何类别中图像的最小数量从 31 增加到 80
c）避免因图像旋转造成的伪影
d）引入了一个新的更大的杂波类别来测试背景拒绝。

4、数据集CelebA介绍

来源：CeleA是香港中文大学的开放数据

简要介绍：包含10177个名人的202599张图片

官网：http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html

5、数据集CIFAR10介绍

来源：CIFAR-10 是由Hinton 的学生Alex Krizhevsky 和Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。

简要介绍： CIFAR-10是一个更接近普适物体的彩色图像数据集。一共包含10 个类别的RGB 彩色图片：飞机（ airplane ）、汽车（ automobile ）、鸟类（ bird ）、猫（ cat ）、鹿（ deer ）、狗（ dog ）、蛙类（ frog ）、马（ horse ）、船（ ship ）和卡车（ truck ）。每个图片的尺寸为32 × 32 ，每个类别有6000个图像，数据集中一共有50000 张训练图片和10000 张测试图片。

6、数据集CIFAR100介绍

来源：

简要介绍：CIFAR100数据集有100个类。每个类有600张大小为32 × 32 32\times 3232×32的彩色图像，其中500张作为训练集，100张作为测试集。对于每一张图像，它有fine_labels和coarse_labels两个标签，分别代表图像的细粒度和粗粒度标签，对应下图中的classes和superclass。也就是说，CIFAR100数据集是层次的。

官网：http://www.cs.toronto.edu/~kriz/cifar.html

7、数据集Cityspaces介绍

简要介绍：Cityscapes拥有5000张在城市环境中驾驶场景的图像（2975train，500 val,1525test）。它具有19个类别的密集像素标注（97％coverage），其中8个具有实例级分割。Cityscapes数据集，即城市景观数据集，这是一个新的大规模数据集，其中包含一组不同的立体视频序列，记录在50个不同城市的街道场景。城市景观数据集中于对城市街道场景的语义理解图片数据集，该大型数据集包含来自50个不同城市的街道场景中记录的多种立体视频序列，除了20000个弱注释帧以外，还包含5000帧高质量像素级注释。因此，数据集的数量级要比以前的数据集大的多。Cityscapes数据集共有fine和coarse两套评测标准，前者提供5000张精细标注的图像，后者提供5000张精细标注外加20000张粗糙标注的图像。

7.1 Cityscapes数据集的特点

像素级标注；
提供算法评估接口。

7.2 Cityscapes数据集的目的

评价视觉算法在城市场景语义理解的主要任务中的性能:像素级、实例级、泛光语义标注;
支持旨在利用大量(弱)注释数据的研究，例如用于训练深度神经网络。

8、数据集CocoCaptions介绍

9、数据集CocoDetection介绍

10、数据集DatasetFolder介绍

11、数据集EMNIST介绍

简要介绍：名字的由来为，Extended MNIST (EMNIST), 因为 MNIST 被大家熟知，但是目前 MNIST 上的精度已经很高了，一个好的数据集应该更具挑战性，所以这里就推出了 EMNIST ，一个在手写字体分类任务中更有挑战的 Benchmark 。在数据集接口上，此数据集的处理方式跟 MNIST 保持一致，也是为了方便已经熟悉 MNIST 的我们去使用，这里着重介绍一下 EMNIST 的分类方式。

分类方式：因为语言及使用习惯的问题，数字比字母多，而字母之间也有差异，所以 EMNIST 主要分为以下 5 类：

By_Class ：共 814255 张，62 类，与 NIST 相比重新划分类训练集与测试机的图片数
By_Merge：共 814255 张，47 类，与 NIST 相比重新划分类训练集与测试机的图片数
Balanced : 共 131600 张，47 类，每一类都包含了相同的数据，每一类训练集 2400 张，测试集 400 张
Digits ：共 28000 张，10 类，每一类包含相同数量数据，每一类训练集 24000 张，测试集 4000 张
Letters : 共 145600 张，26 类，每一类包含相同数据，每一类训练集5600 张，测试集 800 张
MNIST ：共 70000 张，10 类，每一类包含相同数量数据（注：这里虽然数目和分类都一样，但是图片的处理方式不一样，EMNIST 的 MNIST 子集数字占的比重更大）

12、数据集FakeData介绍

13、数据集FashionMNIST介绍

简要介绍：不同于MNIST手写数据集，Fashion-MNIST数据集包含了10个类别的图像，分别是：t-shirt（T恤），trouser（牛仔裤），pullover（套衫），dress（裙子），coat（外套），sandal（凉鞋），shirt（衬衫），sneaker（运动鞋），bag（包），ankle boot（短靴）。

我与懒惰作斗争的日子

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
图片数据集介绍

文章目录1、写在前面2、数据集Caltech101介绍3、数据集Caltech256介绍4、数据集CelebA介绍5、数据集CIFAR10介绍6、数据集CIFAR100介绍7、数据集Cityspaces介绍7.1 Cityscapes数据集的特点7.2 Cityscapes数据集的目的8、数据集CocoCaptions介绍9、数据集CocoDetection介绍10、数据集DatasetFolder介绍11、数据集EMNIST介绍12、数据集FakeData介绍13、数据集FashionMNIST介绍1、
复制链接

扫一扫