口罩检测-数据准备
一、数据结构
新建一个名为mask的文件夹,包含两个子文件images和labels,其中images中有素材图片(jpg),包含带口罩的与没有带口罩的。
二、标注标签
1.在虚拟环境中打开labelimg
1|workon <虚拟环境的名字>
2|labelimg
如下图
点击Open选择mask目录下的images文件夹,点击Open Dir选择mask目录下的labels文件夹,数据类型选择YOLO,图中已为YOLO。
2.标注图片
按W键,用鼠标画框,因为下图没带口罩,所以标注为nomask
按W键,用鼠标画框,因为下图带了口罩,所以标注为mask
打开labels文件夹,可见以下文件
第一个数字1或0分别代表mask或nomask,后面4个数字分别代表框的中心坐标x(x/图片的宽),y(y/图片的高),框的宽w(w/图片的宽),框的高h(h/图片的高)。
三、数据转换
打开YOLO2COCO工具包
在YOLO2COCO\dataset文件下建立一个yolo_mask文件夹,然后将mask移动到此文件夹下,把也classes.txt移到此处。
在此文件夹下打开cmd,在jupyter notebook下新建Python执行以下命令()
import os#operate system 操作系统
os.getcwd()
import random#随机函数
abs_path = os.getcwd()
labels_dir = os.path.join(abs_path,'mask','labels')#获取标签文件
files = os.listdir(labels_dir)#列举所有的标签文件名字
random.shuffle(files)#打乱顺序
total_number = len(files)
train_number = int(total_number * 0.7)#训练集数量
val_number = total_number - train_number#验证集数量
f_train = open("train.txt","w")#以写的方式,打开一个文件,如果没有就新建
f_val = open("val.txt","w")#以写的方式,打开一个文件,如果没有就新建
nomask = 0
mask = 0
for txt_file in files:
txt_path = os.path.join(labels_dir,txt_file)#获取txt的绝对路径
f = open(txt_path,'r')#打开txt
cls = f.readline()[0]#标签
if cls == '0':
nomask += 1
elif cls == '1':
mask += 1
else:
continue
nnomask = 0
nmask = 0
for txt_file in files:
txt_path = os.path.join(labels_dir,txt_file)#获取txt的绝对路径
path_1st = txt_path.split("\\")#根据路径拆分
path_1st[-2] = "images"
path_1st[-1] = path_1st[-1].split(".")[0] + ".jpg"
dst_path = "/".join(path_1st[-5:]) + "\n"
f = open(txt_path,'r')#以读的方式,打开txt
cls = f.readline()[0]#标签,一行一行的读取第一个数字,并赋值到cls
if cls == '0' and nnomask < int(nomask * 0.7):#7
nnomask += 1
f_train.write(dst_path)
elif cls == '0' and nnomask >= int(nomask * 0.7):#3
nnomask += 1
f_val.write(dst_path)
elif cls == '1' and nmask < int(mask * 0.7):#7
nmask += 1
f_train.write(dst_path)
elif cls == '1' and nmask >= int(mask * 0.7):#3
nmask += 1
f_val.write(dst_path)
else:
continue
f_train.close()#操作完关闭文件
f_val.close()#操作完关闭文件
for txt_file in files:
txt_path = os.path.join(labels_dir,txt_file)#获取txt的绝对路径
print(txt_path)
在YOLO2COCO文件夹下启动cmd,在虚拟环境中结合自身情况执行以下命令
python yolov5_2_coco.py --dir_path <yolo_mask的绝对路径>
成功后有路径下有如图所选文件
然后,将它打包成zip,准备上传AI Studio训练。
四、总结
数据集及YOLO2COCO工具包:之后补充~
以上代码仅供参考