【SSD论文解读】 论文中用到的数据集
一、数据集介绍
SSD 论文中使用到的数据集有3个:
1、Pascal VOC
用于图像分类和目标检测两个任务的基准测试,主要由VOC 2007和VOC 2012两部分组成,每部分包含20个常见类别。前者包含5011张训练和验证图像,4952张测试图像;后者包含11540张训练和验证图像,10991张测试图像。
2、MS COCO
用于目标检测与实例分割、人体关键点检测、材料识别、全景分割、图像描述。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。
详见:COCO数据集解析、Dataset之COCO数据集:COCO数据集的简介、下载
3、ILSVRC
是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平,主要项目有图像分类与目标定位、目标检测、视频目标检测、场景分类。
使用ImageNet数据集,包含了超过1400万张全尺寸的有标记图片。ILSVRC比赛会每年从ImageNet数据集中抽出部分样本,以2012年为例,比赛的训练集包含1281167张图片,验证集包含50000张图片,测试集为100000张图片。
详见:ILSVRC竞赛详细介绍(ImageNet Large Scale Visual Recognition Challenge)
二、数据集处理函数
1、专门的datasets类
pytorch针对一些数据集有专门的datasets类,以datasets.VOCDetection为例。来源:pytorch读取VOC数据之VOCDetection
import torchvision.datasets as datasets
voc_trainset = datasets.VOCDetection('G:/jupyter/demo_voc',year='2007', image_set='train', download=False)
print(len(voc_trainset))
2、论文中的数据集处理函数
三、训练时,三种数据集上学习率等参数的修改
四、Pascal voc、COCO上,多种模型mAP对比
1、Pascal voc