这段代码 可以删除掉你下载的数据集里没有打标签的原图文件。当然不指定文件格式。例如:打了YOLO格式的数据集会生成与原图片文件名相同但是扩展名不同的label文件。(eg.原图文件是 person0001.jpg 标签文件是person0001.txt)。在下载了别人的数据集之后,发现图片比标签文件多又不好找时,可以利用下面的代码删除多余图片。
import os
names = os.listdir('D:\wahaha\get_img\labels') #要依据此路径下的文件名做删除操作
train_val = []
for name in names:
index = name.rfind(</