制作自己的VOC2007数据集
JPEGImages放的jpg格式的图片
Annotations 放的是xml 形式,文件名与图片名一一对应(可用labelimg)
ImageSets下有Main文件夹
最后,要把样本分割为训练集、验证集、测试集等。分割情况会在/VOC2007/ImageSets/Main文件夹内的txt文件中进行记录。这里应该有4个txt文件,分别是:train.txt(用于训练的样本,25%)、val.txt(用于验证的样本,25%)、trainval.txt(train与val的合集)、test.txt(用于测试的样本,50%)。
可以将下列的make_txt.py文件,把它放到/VOC2007路径下,然后运行这个python文件,就可以得到样本的分割结果。
import os
import random
trainval_percent = 0.5
train_percent = 0.5
xmlfilepath = ‘./Annotations/’
txtsavepath = ‘./ImageSets/Main/’
total_xml = os.listdir(xmlfilepath)
num=len(total_xml)
list=range(num)
tv=int(numtrainval_percent)
tr=int(tvtrai