![1f70dd46aedef76c6b818da6128429e1.png](https://img-blog.csdnimg.cn/img_convert/1f70dd46aedef76c6b818da6128429e1.png)
1. 简介
PASCAL VOC-Pattern Analysis Statical Modeling and Computational Learning
很多优秀的计算机视觉模型比如分类,定位,检测,分割,动作识别等模型都是基于PASCAL VOC挑战赛及其数据集上推出的,尤其是一些目标检测模型(比如大名鼎鼎的R CNN系列,以及后面的YOLO,SSD等)
2. 数据集
2.1 数据集分类
PASCAL VOC数据集共有4大类,vehicle ,household, animal, person,20小类,下图中黑色加粗字体所示
数据集主要关注分类和检测任务
![03b70d0ea8cc4d2fe3bf5ca73b94c717.png](https://img-blog.csdnimg.cn/img_convert/03b70d0ea8cc4d2fe3bf5ca73b94c717.png)
2.2 数据量
现在研究常用的数据集是VOC2007和VOC2012,VOC07包含9963张图片,总共24640物体,VOC12包含23080张图片,总共54900物体,两者对比如下:
![ec832e320e9fbb9af9564aec9d017319.png](https://img-blog.csdnimg.cn/img_convert/ec832e320e9fbb9af9564aec9d017319.png)
黑色字体所示数字是官方给定的,由于VOC2012数据集中 test 部分没有公布,因此红色字体所示数字为估计数据,按照PASCAL 通常的划分方法,即 trainval 与test 各占总数据量的一半
3. 标注信息格式
标注信息,采用xml文件格式组织如下,参考官网标注信息官网
<annotation>
<folder>VOC2007</folder>
<filename>000001.jpg</filename>
<source>
<database>The VOC2007 Database</database>
<annotation>PASCAL VOC2007</annotation>
<image>flickr</image>
<flickrid>341012865</flickrid>
</source>
<owner>
<flickrid>Fried Camels</flickrid>
<name>Jinky the Fruit Bat</name>
</owner>
<size>
<width>353</width>
<height>500</height>
<depth>3</depth>
</size>
&l