问题陈述
- 首先,我们必须从数字图像中检测人脸
- 第二,认识到检测到的脸部属于谁。
文件夹结构
最初,你应该有这些文件/文件夹(可以私信我获取)
环境
- 安装最新版本的Anaconda 。只需下载并安装它(在提示时添加环境变量)。
可选步骤 - 创建除基础/根环境(anaconda的默认安装附带)之外的另一个环境。
- 一旦anaconda被安装,它的包管理器conda可以用来安装pillow,opencv, likeconda安装 pillow。使用conda的步骤如下。
- 使用命令提示符(& conda)安装jupyter-lab,或者您可以使用任何python编辑器
- 全部数据集中在这里(https://drive.google.com/drive/folders/0B5G8pYUQMNZnLTBVaENWUWdzR0E)(172 GB),如果无法处理整个数据集的话,可以使用上传整个数据集的一个子集(https://drive.google.com/file/d/1bLzzWsRoW3f9cfkjZZzgGTRgawcTXwSH/view)。在test_file上完成预测。
基本组件
我们先了解一些基础知识
播放视频文件-首先我们创建VideoCapture对象并给出视频文件的位置。cap.isOpened()检查相机捕获是否已初始化,它返回值True 。cap.read()一直为True,直到摄像机帧被正确读取。frame从视频文件中获取下一帧,ret从摄像机中获取返回值,可以为true,也可以为false。。cv2.waitKey(1)表示延迟,像1这样的较小值会使视频运行得非常快。接下来,我发现cv2.waitKey(30)的值没有问题。cvtcolor()将捕获的帧转换为灰度(为什么?...如下所述)。cv2.imshow()显示灰度视频。
cap = cv2.VideoCapture('test_file.avi')while(cap.isOpened()): ret, frame = cap.read()gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)cv2.imshow('frame',gray) if cv2.waitKey(1) & 0xFF == ord('q'): break# When everything done, release the capturecap.release()cv2.destroyAllWindows()
Haar Cascades-对象检测是指检测来自特定类的实例,如人脸、自行车、动物、汽车或风筝等。使用基于Haar特征的级联分类器的进行对象检测最初由Paul viola和Michael Jones于2001年提出。我们在这里使用它来检测面孔。另一种检测面部的方法是使用HOG分类器。
OpenCV提供了许多预先训练的分类器,用于检测人脸、眼睛、微笑等。首先,我们需要加载所需的XML分类器。我已经将XML文件(haarcascade_frontalface_alt2.xml)从OpenCV安装中的默认位置移动到srcproject文件夹中的一个文件夹中。
#load haar classifiercv.CascadeClassifier('haarcascadeshaarcascade_frontalface_alt2.xml')
感兴趣的区域---ROI允许我们在不改变整个图像的情况下处理图像的矩形子集。
参数ROI的坐标从左上角开始。detectMultiScale()检测输入图像中不同大小的对象,如果找到人脸,它返回检测到的人脸的位置(x,y,w,h)。比例因子1.5表示每个比例下的图像尺寸缩减。最小邻域5参数指定每个候选矩形应该保留多少个邻域,值越大检测越少,但质量越高。detectMultiScale()中的x、y、w、h的值用于创建感兴趣的区域。
faces = face_cascade.detectMultiScale(gray, 1.5, 5) for(x, y, w, h) in faces: #print(x,y,w,h) roi_gray = gray[y:y+h, x:x+w] #roi_color = frame[y:y+h, x:x+w]
使用训练数据-训练数据在一个名为图像的文件夹中,图像的标签是像Alexandra Daddario这样的文件夹的名称。我们使用os.walk()遍历Image文件夹或目录中的所有图像,找到以png和jpg扩展名结尾的文件。此外,我们提取和转换文件夹名称为小写,并取代空格" ",下划线与破折号-。在计算机图形学中,反锯齿是一种减少锯齿的软件技术,为了减少锯齿-阶梯状的线条应该是平滑的。我们调整图像大小(提高模型的可信度),使用np.array()将图像加载到一个numpy数组中……计算机只理解数字。
for root, dirs, files in os.walk(image_dir): for file in files: if file.endswith("png") or file.endswith("jpg"): path = os.path.join(root, file) label = os.path.basename(root).replace("