PaddleDetection——使用(jpg + xml)制作VOC数据集并建立PD包
voc数据集格式
文件夹目录如图所示:
---VOC ------creat_txt.py ------txt_write.py ------Annotations ---------n个xml文件 ------ImagesSet ---------Main --------trainval.txt --------train.txt --------test.txt --------val.txt ------JPEGImages ---------n个img文件
生成VOC数据集的txt文件
分别将两个python文件放在VOC文件夹下。
生成Main文件下的txt文件
运行creat_txt.py将会生成Main文件夹下的trainval.txt、train.txt、val.txt、test.txt四个txt文件。creat_txt.py
import osimport random#需要根据自己的目录进行修改trainval_percent = 0.95 # 训练集验证集总占比train_percent = 0.9 # 训练集在trainval_percent里的train占比xmlfilepath = r'G:\科创及比赛\智能车\数据集\VOC格式数据集\7_17\标志物0717\data\limit\VOC2007\Annotations'txtsavepath = r'G:\科创及比赛\智能车\数据集\VOC格式数据集\7_17\标志物0717\data\limit\VOC2007\ImageSets/Main'total_xml = os.listdir(xmlfilepath)num = len(total_xml)list = range(num)tv = int(num * trainval_percent)tr = int(tv * train_percent)trainval = random.sample(list, tv)train = random.sample(trainval, tr)ftrainval = open(r'G:\科创及比赛\智能车\数据集\VOC格式数据集\7_17\标志物0717\data\limit\VOC2007\ImageSets\Main\trainval.txt', 'w')ftest = open(r'G:\科创及比赛\智能车\数据集\VOC格式数据集\7_17\标志物0717\data\limit\VOC2007\ImageSets\Main\test.txt', 'w')ftrain = open(r'G:\科创及比赛\智能车\数据集\VOC格式数据集\7_17\标志物0717\data\limit\VOC2007\ImageSets\Main\train.txt', 'w')fval = open(r'G:\科创及比赛\智能车\数据集\VOC格式数据集\7_17\标志物0717\data\limit\VOC2007\ImageSets\Main\val.txt', 'w')for i in list: name = total_xml[i][:-4] + '\n' if i in trainval: ftrainval.write(name) if i in train: ftrain.write(name) else: fval.write(name) else: ftest.write(name)ftrainval.close()ftrain.close()fval.close()ftest.close()
创建label_list
下载PaddleDetection包
git clone https://gitee.com/paddlepaddle/PaddleDetection.git
PD0.2完整资源包下载地址:https://download.csdn.net/download/qq_45779334/12636538
修改预训练模型的Configs配置
在PaddleDetection文件夹中操作。
修改num_classes
修改所用模型ssd_mobilenet_v1_voc.yml配置文件,在PaddleDetection-release-0.2\configs\ssd路径下找到配置文件,修改为自己数据集的的num_classes:
num_classes = (label_class) + 1(background)
修改pascalvoc_label
修改voc.py运行文件,在 PaddleDetection-release-0.2\ppdet\data\source路径下找到配置文件,修改为自己模型的label:
到这里就完成了数据集的创建!
上传至AI studio进行训练
博客链接:https://blog.csdn.net/qq_45779334/article/details/106026210