简介
PASCAL VOC
(The PASCAL Visual Object Classes
)是一个世界级的计算机视觉挑战赛,第一届比赛在2005年举办,随后一年举办一次,直到2012年最后一次。PASCAL
的全称是Pattern Analysis, Statistical modelling and ComputAtional Learning
,官方地址是 http://host.robots.ox.ac.uk/pascal/VOC/
PASCAL VOC
为图像识别和分类提供了一整套标准化的数据集,用来构建和评估用于图像分类(Classification
),目标检测(Object Detection
)和分割(Segmentation
)的算法,我们耳熟能详的计算机视觉模型,如R-CNN
系列、SSD
和YOLO
等等都是基于PASCAL VOC
数据集上推出的
目前最完整的数据集是PASCAL VOC 2012
数据集,而大多数研究者普遍使用的是PASCAL VOC 2007
和PASCAL VOC 2012
这2个数据集,它们二者是互斥的,不相容的。PASCAL VOC 2012
总共包括了20类物体,train
和val
中有11530张图片,共有27450个目标检测标签和6929个分割标签
下图是数据集的类别及其层级结构
这个结构自2007年后就没有改变过
数据集的组织结构
数据集下载后解压,文件结构是这样的
├── Annotations 标签文件,xml格式
├── ImageSets 存放数据集的分割文件
├── JPEGImages 图片文件,jpg格式
├── SegmentationClass 存放按照class类别分割的图片
└── SegmentationObject 存放按照object目标分割的图片
其中Annotations
文件夹
├── 000001.xml
├── 000002.xml
├── 000003.xml
...
一个典型的xml
标签文件如下
各个字段的含义分别是
folder
:所属文件夹filename
:文件名database
:数据库名annotation
:标记文件格式size
:图像尺寸,width
宽、height
高,depth
通道数目segmented
:分割object
: 表示一个目标,name
标签名、pose
拍摄角度,有front
、rear
、left
、right
和unspecified
、truncated
是否被截断也就是图片中是否包含完整目标、difficult
检测难易程度,1表示是、0表示否bndbox
:目标所在的位置,用xmin
、ymin
、xmax
、ymax
来表示
ImageSets
文件夹,存放数据集的分割文件,包含三个子文件夹Action
、Layout
、Main
和Segmentation
,其中Action
文件夹存放用于动作识别文件,Main
文件夹存放的是用于分类和检测的数据集分割文件,Layout
文件夹用于person layout
任务,Segmentation
用于分割任务
评估标准
PASCAL VOC
的评估标准是mAP
(mean Average Precision
),至于mAP
,前文 Precision、Recall、IoU和mAP 已经解释过了,不清楚的可以再去看看
PASCAL
官方给出了评估mAP
的脚本和示例代码,下载地址: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCdevkit_18-May-2011.tar,不过代码是用matlab
写的
获取数据集
PASCAL VOC2007
链接:https://pan.baidu.com/s/1-0U9w_XBGzYpzP4ND25blQ
提取码:zmz6
PASCAL VOC2012
链接:https://pan.baidu.com/s/1cJPer12vhuubqDeLcRQoPQ
提取码:1340
参考资料
http://host.robots.ox.ac.uk/pascal/VOC/