一、下载人脸口罩数据集
下载人脸口罩数据集的链接如下:
https://download.csdn.net/download/qq_42451251/12566250
而后将数据集重命名为连续序列,重命名代码如下:
#对数据集重命名
#coding:utf-8
import os
path = "F:\\mask\\have_mask" #你的路径
filelist = os.listdir(path)
count=1000 #开始文件名1000.jpg
for file in filelist:
Olddir=os.path.join(path,file)
if os.path.isdir(Olddir):
continue
filename=os.path.splitext(file)[0]
filetype=os.path.splitext(file)[1]
Newdir=os.path.join(path,str(count)+filetype)
os.rename(Olddir,Newdir)
count+=1
同样对负样本进行重命名。
而后在对正负样本数据集进行像素处理:
代码如下:
#修改正样本像素
import pandas as pd
import cv2
for n in range(1000,1606):#代表正数据集中开始和结束照片的数字
path='F:\\mask\\have_mask\\'+str(n)+&