opencv图像处理
Haar级联
由于灯光、视角、视距、摄像头抖动以及数字噪声的变化,一个图像的细节可能会变得不稳定。但是人们在分类时却不会受这些物理细节方面差异的影响。因此,提取出图像的细节对产生稳定分类结果和跟踪结果很有用。即:从图像中提取特征。虽然任意像素都可能影响多个特征,但特征应该比像素数少得多。由此两个图像的相似程度可以通过它们对应特征的欧氏距离来度量。
类Haar特征是一种用于实现实时人脸跟踪的特征。每个类Haar特征都描述了相邻图像区域的对比模式。
对给定的图像,特征可能会因区域大小而有所不同,区域大小也可被称为窗口大小。但是,仅在尺度上不同的两幅图像也应该有相似的特征。因此,能为不同大小的窗口生成特征非常有用。这些特征集合称为级联。Haar级联具有尺度不变性,但是不具有旋转不变性。
Haar 级联数据在opencv包中有带,在人脸检测中会用到
D:\Anaconda3\Lib\site-packages\cv2\data
- 人脸检测器(默认) : haarcascade_frontalface_default.xml
- 人脸检测器(快速 Harr) : haarcascade_frontalface_alt2.xml
- 人脸检测器(侧视) : haarcascade_profileface.xml
- 眼部检测器(左眼) : haarcascade_lefteye_2splits.xml
- 眼部检测器(右眼) : haarcascade_righteye_2splits.xml
- 嘴部检测器: haarcascade_mcs_mouth.xml
- 鼻子检测器: haarcascade_mcs_nose.xml
- 身体检测器: haarcascade_fullbody.xml
- 人脸检测器(快速 LBP) : lbpcascade_frontalface.xml
使用opencv进行人脸检测
静态图像中人脸检测
人脸检测首先是加载图像并检测人脸, 这也是最基本的一步。 为了使所得到的结果有意义, 可在原始图像的人脸周围绘制矩形框。
cv.CascadeClassifier 会返回一个face区域
在这个区域里面可以获取它所对应的坐标import cv2 as cv import numpy as np from matplotlib import pyplot as plt def face_detect_demo(): gray=cv.cvtColor(src,cv.COLOR_BGR2GRAY) #灰度处理 face_detector=cv.CascadeClassifier('D:\\Anaconda3\\Lib\\site-packages\\cv2\\data\\haarcascade_frontalface_default.xml') faces=face_detector.detectMultiScale(gray,1.02,5) for x,y,w,h in faces: #检测出来的人脸区域给它绘制个矩形 cv.rectangle(src,(x,y),(x+w,y+h),color=(0,0,255)) cv.imshow('result',src) src = cv.imread('lenna.jpg') cv.imshow('result',src) face_detect_demo() cv.waitKey(0) cv.destroyAllWindows()
要想框是只要color=(0,255,0)即可
检测多张人脸
import cv2 as cv import numpy as np from matplotlib import pyplot as plt def face_detect_demo(): gray=cv.cvtColor(img,cv.COLOR_BGR2GRAY) face_detector=cv.CascadeClassifier('D:\\Anaconda3\\Lib\\site-packages\\cv2\\data\\haarcascade_frontalface_default.xml') faces = face_detector.detectMultiScale(img) #修改检测参数 scaleFactor minNeighbors #scaleFactor是对区域进行缩放的比例,minNeighbors是最少检测几次 #faces=face_detector.detectMultiScale(img,scaleFactor=1.03,minNeighbors=10,minSize=(60,60)) faces=face_detector.detectMultiScale(img,scaleFactor=1.03,minNeighbors=10) for x,y,w,h in faces: print(x,y,w,h) cv.rectangle(img,(x,y),(x+w,y+h),color=(0,0,255),thickness=2) cv.circle(img,center=(x+w//2,y+h//2),radius=w//2,color=(0,255,0),thickness=2) cv.imshow('result',img) #加载图片 img = cv.imread('mulface1.jpg') cv.imshow('result',img) face_detect_demo() cv.waitKey(0) cv.destroyAllWindows()
faces=face_detector.detectMultiScale(img,scaleFactor=1.03,minNeighbors= ,maxSize=(), minSize=(60,60))
修改检测参数 scaleFactor minNeighbors minSize和maxSize
scaleFactor是对区域进行缩放的比例,minNeighbors是最少检测几次
minSize和maxSize用来限制得到的目标区域的范围,即当前检测区域的最大大小和最小大小
maxsize=(30,30)就是w和h,限制在30,30
scalefactor=1.03
scalefactor=1.09
当scalefactor=1.03 minNeighbors=10
当scaleFactor=1.03,minSize=(60,60)
当人脸识别得有问题的时候,我们可以通过这样的调参来调整得出正确的结果
视频中的人脸检测
视频的每一帧都是一张一张图片组成的, 我们检测视频中的人脸,其实就是检测它每一帧的图片上的人脸。在视频的帧上重复这个过程就能完成视频中的人脸检测。
import cv2 as cv def face_detect_demo(img): #将图片灰度 gray=cv.cvtColor(img,cv.COLOR_BGR2GRAY) #加载特征数据 face_detector = cv.CascadeClassifier( 'D:\\Anaconda3\\Lib\\site-packages\\cv2\\data\\haarcascade_frontalface_default.xml') faces = face_detector.detectMultiScale(gray,minNeighbors=15) for x,y,w,h in faces: #print(x,y,w,h) cv.rectangle(img,(x,y),(x+w,y+h),color=(0,0,255),thickness=2) #cv.circle(img,center=(x+w//2,y+h//2),radius=(w//2),color=(0,255,0),thickness=2) cv.imshow('result',img) #读取视频 cap=cv.VideoCapture('video.mkv') while True: flag,frame=cap.read() #frame就是当前这一帧上面对应的图片 #如果视频一直在播放,flag就是True print('flag:',flag,'frame.shape:',frame.shape) if not flag: break face_detect_demo(frame) if ord('q') == cv.waitKey(10): break cv.destroyAllWindows() #释放内存空间 cap.release() #释放视频空间
按q终止播放