背景:使用labelImg对图片数据集进行标注,有的图片标注了,有的没有标注。标注了的图片会在另一个文件夹annotations中生成对应的xml注释信息。现在要把没有标注的图片筛选出来,然后删除。
import os
filePath1 = r'F:\目标检测\数据标注\test\annotations'
filePath2 = r'F:\目标检测\数据标注\test\image'
list1 = os.listdir(filePath1)
file_list1 = [] #annotations中的文件名列表 不带后缀
for i in list1:
file_list1.append(os.path.splitext(i)[0])
# print(file_list1)
list2 = os.listdir(filePath2)
file_list2 = [] #image中的文件名列表 不带后缀
for i in list2:
file_list2.append(os.path.splitext(i)[0])
# print(file_list2)
#找出没有标注的图片名称列表
b = [y for y in file_list2 if y not in file_list1]
#把这些列表加上扩展名 然后将其删除
path = r'F:\目标检测\数据标注\test\image_f'
for i in b:
os.remove(os.path.join(path, i+'.jpg'))
总结:
1.os.listdir()返回一个路径下的所有文件
2.os.path.splitext(i)可以把带后缀的文件名分成两部分(文件名,扩展名) 以一个元组的形式返回
3.os.path.remove()根据路径删除相应文件 参数一定要是一个文件路径 文件夹路径会报错