在对SSD模型进行微调的时候需要重新准备数据集,简单梳理一下数据集的准备流程,大致可以分为以下几步:
1.数据标注
常用的数据标注工具有labelImg、ImageLabel、Yolo_mark 、BBox-Label-Tool,在此使用的是labelimg
2.生成txt文件
在1中对数据标注过后会有对应的xml文件生成,需要将他们转化成txt文件,在此使用的是python语言自动完成(需要注意路径)
import os
import random
#先划分训练集+验证集(0.8)和测试集,再将训练集+验证集划分开(一样一半)
trainval_percent = 0.8
train_percent = 0.7
xmlfilepath = 'C:\\Users\\asus\\Desktop\\Annotations'
txtsavepath = 'C:\\Users\\asus\\Desktop\\ImageSets\\Main'
total_xml = os.listdir(xmlfilepath)
num=len(total_xml)
tv=int(num*trainval_percent)#训练集+验证集
tr=int(tv*train_percent) #训练集
trainval= random.sample