问题描述
目标检测过程中,数据集采用voc格式,图片文件与标签文件数目不一致,图片文件多于标签文件(二者是包含关系,不是交叉关系)导致服务器无法正常工作。
问题解决
1 首先读取Annotations文件夹下所有文件的名字
2 将Annotations文件夹下所有文件的名字后缀由‘xml’改为‘jpg’
3 遍历JEPGImages文件夹中的所有图片文件,读出名字与步骤2中名字相同的图片文件,并移动到另一个新文件夹
详细代码
import shutil
import os
#--------------------------------------------------------------
#读取Annotations文件夹下所有文件的名字并写入txt
path = "VOCdevkit/VOC2007/Annotations"
datanames = os.listdir(path)
f