【深度学习论文阅读】计算机视觉领域数据集

1.MNIST

MNIST是一个手写数字数据集(灰度图像),发布于1998年。来自美国国家标准与技术研究所(National Institute of Standards and Technology)。样本包含50%的高中学生,50%是人口普查局的工作人员。图片内容为0-9的数字,图片大小为28*28pixel。其中训练数据包含6w个样本,测试集数据包含1w个样本。

缺点:

  • 灰度图像
  • 类别少,只有手写数字
  • 非真实数据,没有真实数据的局部特性
    下载地址:MNIST数据集
2.CIFAR

CIFAR包含两个数据,由Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton等人收集(AlexNet作者)。于2009年发布。
它分为CIFAR-10和CIFAR-100,其中-的数字代表分类类别。
CIFAR-10也是仅用于分类的数据集。数据集包含6w张彩色图片,图像大小为32*32pixel。共十个类别,每个类别6k张图。其中训练数据5w张,测试数据1w张。
特点:

  • 真实图片
  • 图中只有一个主体目标
    CIFAR-100包含100个分类类别,每个类别包含600张图。注意,100各类别可以被细化为20个大类,所以每个图像带有大类标签coarse和小磊标签fine。

下载地址:CIFAR下载地址

3.PASCAL

PASCAL即Pattern Analysis, Statistical Modelling and Computational learning,是用于模式分析和统计建模的数据集,包括图像分类、目标检测以及图像分割等任务。于2005年首发,到2012年止。
下载地址:PASCAL下载地址

4.ImageNet

由斯坦福李飞飞博士主导,于2009年发布。包含1400w张图片,涵盖2w+类别标注和超过百万的边界框标注,每一类别有500-1000张图片。
为此自2010年开始到2017年,共举办Large Scale Visual Reconginition Challenge(ILSVRC)比赛,包含图像分类、目标检测、目标定位等。
历史意义:让陷于过拟合的算法,从数据集本身看到了新的出路。
下载地址:ImageNet下载地址

5.Mircosoft COCO

MSRA,亚洲微软研究院2014年发布。对标PASCAL、ImageNet数据集。可用于图像分类、分割、目标检测等多任务。共30+数据。包含91个类别,以人类4岁小孩能辨识为基准。其中82种,有超过5000个instance(同一类不同的个体)
下载地址:COCO下载地址


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值