【深度学习论文阅读】计算机视觉领域数据集

最新推荐文章于 2024-04-07 18:01:25 发布

LawenceRay

最新推荐文章于 2024-04-07 18:01:25 发布

阅读量404

点赞数

分类专栏：深度学习文章标签：深度学习论文阅读

本文链接：https://blog.csdn.net/LawenceRay/article/details/89355286

版权

深度学习专栏收录该内容

34 篇文章 1 订阅

订阅专栏

1.MNIST

MNIST是一个手写数字数据集（灰度图像），发布于1998年。来自美国国家标准与技术研究所(National Institute of Standards and Technology)。样本包含50%的高中学生，50%是人口普查局的工作人员。图片内容为0-9的数字，图片大小为28*28pixel。其中训练数据包含6w个样本，测试集数据包含1w个样本。

缺点：

灰度图像
类别少，只有手写数字
非真实数据，没有真实数据的局部特性
下载地址：MNIST数据集

2.CIFAR

CIFAR包含两个数据，由Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton等人收集（AlexNet作者）。于2009年发布。
它分为CIFAR-10和CIFAR-100，其中-的数字代表分类类别。
CIFAR-10也是仅用于分类的数据集。数据集包含6w张彩色图片，图像大小为32*32pixel。共十个类别，每个类别6k张图。其中训练数据5w张，测试数据1w张。
特点：

真实图片
图中只有一个主体目标
CIFAR-100包含100个分类类别，每个类别包含600张图。注意，100各类别可以被细化为20个大类，所以每个图像带有大类标签coarse和小磊标签fine。

下载地址：CIFAR下载地址

3.PASCAL

PASCAL即Pattern Analysis, Statistical Modelling and Computational learning，是用于模式分析和统计建模的数据集，包括图像分类、目标检测以及图像分割等任务。于2005年首发，到2012年止。
下载地址:PASCAL下载地址

4.ImageNet

由斯坦福李飞飞博士主导，于2009年发布。包含1400w张图片，涵盖2w+类别标注和超过百万的边界框标注，每一类别有500-1000张图片。
为此自2010年开始到2017年，共举办Large Scale Visual Reconginition Challenge（ILSVRC）比赛，包含图像分类、目标检测、目标定位等。
历史意义：让陷于过拟合的算法，从数据集本身看到了新的出路。
下载地址：ImageNet下载地址