我在进行目标检测时候,比如红绿灯检测,目标区域很小,样本杂乱。
想要筛选错误样本的话,很困难。可以把目标区域裁剪出来。人大脑处理对于这样的异己比较敏感。样本量较少的话可以自己筛一筛。样本量较大的话,可以训练一个分类模型帮你筛一下。
它就可以实现一个目标检测的数据集可以转化为一个分类的数据集。
这个是根据txt标签文件进行筛选的,大同小异,别的文件类型也就是登录读取信息不一样。
它最终会读取你目标检测的每一个类,然后每个类会创建一个就叫这个类名的文件夹,然后裁剪出来的这一类的图片。最后图片的文件名就是你的”原文件名+num“。
#根据预测出来的txt文件裁剪图片
import os
import cv2
from tqdm import tqdm
image_input = '/home/xys/CloundShiProjects/traffic_light/trafficlight_dect/data/JPEGImages/'
txt_input = '/home/xys/CloundShiProjects/traffic_light/trafficlight_dect/data/labels/'
path_output = "/home/xys/CloundShiProjects/traffic_light/trafficlight_dect/crop/" # 裁剪出来的小图保存的根目录
class_names_path = '/home/xys/CloundShiProjects/traffic_light/trafficlight_dect/data/classes.txt'
img_total = []
txt_total = []
def read_class_name(path):