PASCAL的全称:Pattern Analysis, Statistical Modelling And Computational Learning
VOC的全称:Visual Object Classes
PASCAL VOC提供了标准化的图像数据集,并且可以评估和比较不同的算法
当前的一些流行算法,比如:faster-rcnn,yolo -v1, yolo-v2都采用VOC-2007数据集作为演示样例,因此,有必要了解一下本数据集的组成架构。
一、PASCAL VOC 2007数据集
该数据集由以下五个部分组成:
1、Annotations文件夹
该文件下存放的是xml格式的标签文件,一张图片对应于一个xml文件,xml文件记录了目标区域的坐标和大小,目标类别等相关信息。
2、JPEGImages文件夹
该文件夹下存放的是数据集图片,包括训练集和测试集的图片。
3、ImageSets文件夹
该文件夹下存放了三个文件,分别是Layout、Main、Segmentation。目标检测只要使用其中的存放图像数据的Main文件即可。
4、SegmentationClass文件和SegmentationObject文件。
这两个文件夹都是存放与图像分割相关的内容。