目录
一、VOC数据集构建
(1)VOC格式介绍
VOC 是目标检测一种通用的标准数据集格式,下面我以VOC2007数据集为例,来制作VOC标准数据集。整个数据集文件的目录结构如下图所示:
其中,VOC2007目录下存在着三个不同的文件,其具体作用是:
- Annotations:存放数据集的xml标签文件,xml文件需要进行解析。
- ImageSets:用来存放训练集或者测试集中图片ID的txt文件。
- JPEGImages:存放数据集原图
(2)划分数据集
将数据集整体划分为训练集和测试集,比例为9:1。将所有图片ID号随机打乱,按照9:1的比