一、制作自己的VOC2007数据集
1. VOC2007数据集格式
1)JPEGImages文件夹
文件夹里包含了训练图片和测试图片,混放在一起
2)Annatations文件夹
文件夹存放的是xml格式的标签文件,每个xml文件都对应于JPEGImages文件夹的一张图片。
3)ImageSets文件夹
Main存放的是图像物体识别的数据,Main里面有test.txt , train.txt, val.txt , trainval.txt.这四个文件。
2.准备照片素材,标注每张图片
- 图片重命名
命名统一为六位数字,从000001开始。
参考:
Tensorflow Object Detection API-如何制作VOC格式数据集
工具来源: https://github.com/whlook/VOCMaker
目标物体标注
工具来源:https://github.com/puzzledqs/BBox-Label-Tool
编写脚本将标注选取的坐标数据写入到一个txt文件中,txt文件每行格式为:000001.JPG dog 44 28 132 121
如果一张图片有多个目标(比如两个目标),则格式如下:
000001.JPG dog 44 28 132 121 000001.JPG car 50 27 140 110
将标注的txt文件生成xml:
参考代码:matlab程序VOC2007xml