【SSD论文解读】 论文中用到的数据集:Pascal VOC、MS COCO、ImageNet

一、数据集介绍

SSD 论文中使用到的数据集有3个:

1、Pascal VOC

用于图像分类目标检测两个任务的基准测试,主要由VOC 2007VOC 2012两部分组成,每部分包含20个常见类别。前者包含5011张训练和验证图像,4952张测试图像;后者包含11540张训练和验证图像,10991张测试图像。

详见:PASCAL VOC2012 数据集详解
VOC 2007文件结构

VOC 2007文件结构

2、MS COCO

用于目标检测与实例分割、人体关键点检测、材料识别、全景分割、图像描述。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。

详见:COCO数据集解析Dataset之COCO数据集:COCO数据集的简介、下载

3、ILSVRC

是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平,主要项目有图像分类与目标定位、目标检测、视频目标检测、场景分类

使用ImageNet数据集,包含了超过1400万张全尺寸的有标记图片。ILSVRC比赛会每年从ImageNet数据集中抽出部分样本,以2012年为例,比赛的训练集包含1281167张图片,验证集包含50000张图片,测试集为100000张图片。

详见:ILSVRC竞赛详细介绍(ImageNet Large Scale Visual Recognition Challenge)

二、数据集处理函数

1、专门的datasets类

pytorch针对一些数据集有专门的datasets类,以datasets.VOCDetection为例。来源:pytorch读取VOC数据之VOCDetection

import torchvision.datasets as datasets
voc_trainset = datasets.VOCDetection('G:/jupyter/demo_voc',year='2007', image_set='train', download=False)
print(len(voc_trainset))

2、论文中的数据集处理函数

详见:目标检测算法之SSD的数据增强策略
在这里插入图片描述

三、训练时,三种数据集上学习率等参数的修改

在这里插入图片描述

四、Pascal voc、COCO上,多种模型mAP对比

1、Pascal voc

Pascal VOC2007
Pascal VOC2012

2、COCO

COCO

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值