深度学习很多框架都在使用VOC数据集格式,所以先来研究一下voc数据集的具体内容。
以PASCAL VOC2017为例,它包含如下5个文件夹:
- JPEGImages
- Annotations
- ImageSets
- SegmentationClass
- SegmentationObject
1、JPEGImages
PASCAL VOC提供的所有的图片,其中包括训练图片,测试图片。
2、Annotations
存放xml格式的标签文件,每个xml对应JPEGImage中的一张图片。并且每个xml中存放的是标记的各个目标的位置和类别(C=20)信息,命名通常与对应的原始图像一样,以(x,y)的格式保存坐标点。可使用labelImg进行标注和查看。
图像标注工具labelImg安装教程及使用方法
<annotation>
<folder>VOC2012</folder>
<filename>2007_000392.j