PASCAL VOC2012数据集分析
Pascal VOC2012官网地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
PASCAL VOC论文:http://host.robots.ox.ac.uk/pascal/VOC/pubs/everingham15.pdf
一、简介
PASCAL VOC挑战赛 (The PASCAL Visual Object Classes Challenge)是关于计算机视觉的挑战赛,PASCAL VOC挑战赛主要包括以下几类:分类(Classification),检测(Detection),分割(Segmentation),行为识别(Action Classification) 等。
- 图像分类与检测
分类:在测试图像预测是否为二十个分类之一,正确分类。
检测:在测试图像上预测二十个分类对象的有无与位置信息。
- 图像分割
分割:图像分割一般包括实例分割和语义分割,实例分割是要把每个单独的目标用一种颜色表示(如下图中间的图像),而语义分割只是把同一类别的所有目标用同一颜色表示(如下图右侧的图片)。
- 行为识别
行为识别:预测图像中人的行为动作
- Person Layout标注
Person Layout标注:检测人与其各个身体组成部分,如果手、脚、头等。
二、PASCAL VOC2012数据集
Pascal VOC2012数据集主要是针对视觉任务中监督学习提供标签数据,它有二十个类别:
Person:person
Animal: bird, cat, cow, dog, horse, sheep
Vehicle:aeroplane, bicycle, boat, bus, car, motorbike, train
Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
下载路径: http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html#devkit
下载完之后解压文件,打开VOCdevkit-VOC2012可以看到如下文件。
Annotations文件夹
Annotations文件夹中存放的是xml格式的标签文件,每一个xml文件都对应于JPEGImages文件夹中的一张图片,一共有17125个项目文件。
xml文件具体格式如下图所示,
<annotation>
<folder>VOC2012</folder>
<filename>2007_000027.jpg</filename> //文件名
<source