python+opencv之视频人脸识别

Python代码
  1. import  sys  
  2. from  CVtypes  import  cv  
  3.   
  4.   
  5. def  detect(image):  
  6.   
  7.     image_size = cv.GetSize(image)  
  8.   
  9.     # create grayscale version   
  10.     grayscale = cv.CreateImage(image_size, 8  1 )  
  11.   
  12.     cv.CvtColor(image, grayscale, cv.BGR2GRAY)  
  13.   
  14.     # create storage   
  15.     storage = cv.CreateMemStorage(0 )  
  16.   
  17.     cv.ClearMemStorage(storage)  
  18.   
  19.     # equalize histogram   
  20.     cv.EqualizeHist(grayscale, grayscale)  
  21.   
  22.     # detect objects   
  23.     cascade = cv.LoadHaarClassifierCascade('haarcascade_frontalface_alt.xml' , cv.Size( 1 , 1 ))  
  24.   
  25.     faces = cv.HaarDetectObjects(grayscale, cascade, storage, 1.2  2 , cv.HAAR_DO_CANNY_PRUNING, cv.Size( 350  350 ))  
  26.     print  faces  
  27.   
  28.     if  faces:  
  29.         print   'face detected!'   
  30.         for  i  in  faces:  
  31.             cv.Rectangle(image, cv.Point( int(i.x), int(i.y)),  
  32.                          cv.Point(int(i.x + i.width), int(i.y + i.height)),  
  33.                          cv.RGB(0  255  0 ),  3  8  0 )  
  34.   
  35. if  __name__ ==  "__main__" :  
  36.     print   "OpenCV version: %s (%d, %d, %d)"  % (cv.VERSION,  
  37.                                                cv.MAJOR_VERSION,  
  38.                                                cv.MINOR_VERSION,  
  39.                                                cv.SUBMINOR_VERSION)  
  40.   
  41.     print   "Press ESC to exit ..."   
  42.   
  43.     # create windows   
  44.     cv.NamedWindow('Camera' , cv.WINDOW_AUTOSIZE)  
  45.   
  46.   
  47.     # create capture device   
  48.     device = 0   # assume we want first device   
  49.     capture = cv.CreateCameraCapture(-1 )  
  50.   
  51.     cv.SetCaptureProperty(capture, cv.CAP_PROP_FRAME_WIDTH, 640 )  
  52.     cv.SetCaptureProperty(capture, cv.CAP_PROP_FRAME_HEIGHT, 480 )     
  53.   
  54.     # check if capture device is OK   
  55.     if   not  capture:  
  56.         print   "Error opening capture device"   
  57.         sys.exit(1 )  
  58.   
  59.      
  60.   
  61.   
  62.     while   1 :  
  63.         # do forever   
  64.   
  65.         # capture the current frame   
  66.         frame = cv.QueryFrame(capture)  
  67.         if  frame  is   None :  
  68.             break   
  69.   
  70.         # mirror   
  71.         cv.Flip(frame, None  1 )  
  72.   
  73.         # face detection   
  74.         detect(frame)  
  75.   
  76.         # display webcam image   
  77.         cv.ShowImage('Camera' , frame)  
  78.   
  79.         # handle events   
  80.         k = cv.WaitKey(10 )  
  81.   
  82.         if  k ==  0x1b  # ESC   
  83.             print   'ESC pressed. Exiting ...'   
  84.             break   
[python] view plain copy print ?
  1. import sys  
  2. from CVtypes import cv  
  3.   
  4.   
  5. def detect(image):  
  6.   
  7.     image_size = cv.GetSize(image)  
  8.   
  9.     # create grayscale version  
  10.     grayscale = cv.CreateImage(image_size, 81)  
  11.   
  12.     cv.CvtColor(image, grayscale, cv.BGR2GRAY)  
  13.   
  14.     # create storage  
  15.     storage = cv.CreateMemStorage(0)  
  16.   
  17.     cv.ClearMemStorage(storage)  
  18.   
  19.     # equalize histogram  
  20.     cv.EqualizeHist(grayscale, grayscale)  
  21.   
  22.     # detect objects  
  23.     cascade = cv.LoadHaarClassifierCascade('haarcascade_frontalface_alt.xml', cv.Size(1,1))  
  24.   
  25.     faces = cv.HaarDetectObjects(grayscale, cascade, storage, 1.22, cv.HAAR_DO_CANNY_PRUNING, cv.Size(350350))  
  26.     print faces  
  27.   
  28.     if faces:  
  29.         print 'face detected!'  
  30.         for i in faces:  
  31.             cv.Rectangle(image, cv.Point( int(i.x), int(i.y)),  
  32.                          cv.Point(int(i.x + i.width), int(i.y + i.height)),  
  33.                          cv.RGB(02550), 380)  
  34.   
  35. if __name__ == "__main__":  
  36.     print "OpenCV version: %s (%d, %d, %d)" % (cv.VERSION,  
  37.                                                cv.MAJOR_VERSION,  
  38.                                                cv.MINOR_VERSION,  
  39.                                                cv.SUBMINOR_VERSION)  
  40.   
  41.     print "Press ESC to exit ..."  
  42.   
  43.     # create windows  
  44.     cv.NamedWindow('Camera', cv.WINDOW_AUTOSIZE)  
  45.   
  46.   
  47.     # create capture device  
  48.     device = 0 # assume we want first device  
  49.     capture = cv.CreateCameraCapture(-1)  
  50.   
  51.     cv.SetCaptureProperty(capture, cv.CAP_PROP_FRAME_WIDTH, 640)  
  52.     cv.SetCaptureProperty(capture, cv.CAP_PROP_FRAME_HEIGHT, 480)     
  53.   
  54.     # check if capture device is OK  
  55.     if not capture:  
  56.         print "Error opening capture device"  
  57.         sys.exit(1)  
  58.   
  59.      
  60.   
  61.   
  62.     while 1:  
  63.         # do forever  
  64.   
  65.         # capture the current frame  
  66.         frame = cv.QueryFrame(capture)  
  67.         if frame is None:  
  68.             break  
  69.   
  70.         # mirror  
  71.         cv.Flip(frame, None1)  
  72.   
  73.         # face detection  
  74.         detect(frame)  
  75.   
  76.         # display webcam image  
  77.         cv.ShowImage('Camera', frame)  
  78.   
  79.         # handle events  
  80.         k = cv.WaitKey(10)  
  81.   
  82.         if k == 0x1b# ESC  
  83.             print 'ESC pressed. Exiting ...'  
  84.             break  

 #需要下载CVtypes.py 及haarcascade_frontalface_alt.xml

 

前言
关于opencv
OpenCV 是 Intel 开源计算机视觉库 (Computer Version) 。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。 

  

OpenCV 拥有包括 300 多个 C 函数的跨平台的中、高层 API 。它不依赖于其它的外部库 —— 尽管也可以使用某些外部库。 OpenCV 对非商业应用和商业应用都是免费 的。同时 OpenCV 提供了对硬件的访问,可以直接访问摄像头,并且 opencv 还提供了一个简单的 GUI(graphics user interface) 系统 :highgui 。 我们就通过 OpenCV 提供的一些方法来构造出这个人脸检测 ( face detection ) 程序来。 

opencv的python包装
 

OpenCV 本身是有 C/C++ 编写的,如果要在其他语言中使用,我们可以通过对其动态链接库文件进行包装即可,幸运的是, Python 下有很多个这样的包装,本文中使用的是 Cvtypes 。 

  

事实上,在 Python 中很多的包都是来自第三方的,比如 PIL(Python Image Library) 即为 C 语言实现的一个图形处理包,被包装到了 Python 中,这些包装可以让你像使用 Python 的内建函数一样的使用这些 API 。 

 

人脸检测原理
人脸检测属于目标检测(object detection) 的一部分,主要涉及两个方面

先对要检测的目标对象进行概率统计,从而知道待检测对象的一些特征,建立起目标检测模型。 
用得到的模型来匹配输入的图像,如果有匹配则输出匹配的区域,否则什么也不做。 
 

计算机视觉
计算机的视觉系统,跟人的眼睛是大不相同的,但是其中也有类似之处。人眼之能够看到物体,是通过物体上反射出来的光线刺激人眼的感光细胞,然后视觉神经在大脑中形成物体的像。计算机通过摄像头看到的东西要简单的多,简单来说,就是一堆由数字组成的矩阵。这些数字表明了物体发出的光的强弱,摄像头的光敏元件将光信号转化成数字信号,将其量化为矩阵。

如何从这些数字中得出:"这是一个人脸"的结论,是一个比较复杂的事情。物理世界是彩色的,一般来说,计算机中的彩色图片都是由若干个色彩通道累积出来的,比如RGB模式的图片,有红色通道(Red),绿色通道(Green)和蓝色通道 (Blue),这三个通道都是灰度图,比如一个点由8位来表示,则一个通道可以表示2^8=256个灰度。那样三个通道进行叠加以后可以表3*8=24位种色彩,也就是我们常说的24位真彩。

对这样的图片做处理,无疑是一件很复杂的事,所以有必要先将彩色图转为灰度图,那样可以减少数据量 (比如RGB模式,可以减少到原图片的1/3),同时可以去掉一些噪声信号。先将图片转化为灰度图,然后将这个灰度图的对比度增高,这样可以使得图片本来暗的地方更暗,亮的地方更亮一些。这样处理以后,图片就更容易被算法设别出来了。

Harr特征级联表
OpenCV在物体检测上使用的是haar特征的级联表,这个级联表中包含的是boost的分类器。首先,人们采用样本的haar特征进行分类器的训练,从而得到一个级联的boost分类器。训练的方式包含两方面:

1.    正例样本,即待检测目标样本
2.    反例样本,其他任意的图片

首先将这些图片统一成相同的尺寸,这个过程被称为归一化,然后进行统计。一旦分类器建立完成,就可以用来检测输入图片中的感兴趣区域的检测了,一般来说,输入的图片会大于样本,那样,需要移动搜索窗口,为了检索出不同大小的目标,分类器可以按比例的改变自己的尺寸,这样可能要对输入图片进行多次的扫描。

什么是级联的分类器呢?级联分类器是由若干个简单分类器级联成的一个大的分类器,被检测的窗口依次通过每一个分类器,可以通过所有分类器的窗口即可判定为目标区域。同时,为了考虑效率问题,可以将最严格的分类器放在整个级联分类器的最顶端,那样可以减少匹配次数。

基础分类器以haar特征为输入,以 0/1为输出,0表示未匹配,1表示匹配。

Haar特征
 

在扫描待检测图片的时候,以边界特征中的(a)为例,正如前面提到的那样,计算机中的图片是一个数字组成的矩阵,程序先计算整个窗口中的灰度值x,然后计算矩形框中的黑色灰度值y,然后计算(x-2y)的值,得到的数值与x做比较,如果这个比值在某一个范围内,则表示待检测图片的当前扫描区域符合边界特征(a),然后继续扫描。

关于这个算法的更详细描述已经超出了本文的范围,可以在参考资源中获得更多的信息。

 

非固定大小目标检测
因为是基于视频流的目标检测,我们事先不太可能知道要检测的目标的大小,这就要求我们的级联表中的分类器具有按比例增大(或者缩小)的能力,这样,当小的窗口移动完整个待检测图片没有发现目标时,我们可以调整分类器的大小,然后继续检测,直到检测到目标或者窗口与待检测图片的大小相当为止。

 

 

步骤一:图片预处理
在从摄像头中获得一个帧(一张图片)后,我们需要先对这张图片进行一些预处理:

将图片从RGB模式转为灰度图将灰度图 
进行灰度图直方图均衡化操作 

这两个步骤在OpenCV中是非常简单的:

image_size = cv.cvGetSize(image)#获取原始图像尺寸    
   
grayscale = cv.cvCreateImage(image_size, 8, 1)# 建立一个空的灰度图    
cv.cvCvtColor(image, grayscale, cv.CV_BGR2GRAY)#转换    
   
storage = cv.cvCreateMemStorage(0)#新建一块存储区,以备后用    
cv.cvClearMemStorage(storage)    
   
cv.cvEqualizeHist(grayscale, grayscale)# 灰度图直方图均衡化   
image_size = cv.cvGetSize(image)#获取原始图像尺寸
grayscale = cv.cvCreateImage(image_size, 8, 1)# 建立一个空的灰度图
cv.cvCvtColor(image, grayscale, cv.CV_BGR2GRAY)#转换
storage = cv.cvCreateMemStorage(0)#新建一块存储区,以备后用
cv.cvClearMemStorage(storage)
cv.cvEqualizeHist(grayscale, grayscale)# 灰度图直方图均衡化 

步骤二:检测并标记目标
OpenCV中,对于人脸检测的模型已经建立为一个XML文件,其中包含了上面提到的harr特征的分类器的训练结果,我们可以通过加载这个文件而省略掉自己建立级联表的过程。有了级联表,我们只需要将待检测图片和级联表一同传递给OpenCV的目标检测算法即可得到一个检测到的人脸的集合。

# detect objects    
cascade = cv.cvLoadHaarClassifierCascade('haarcascade_frontalface_alt.xml',    
                                            cv.cvSize(1,1))    
faces = cv.cvHaarDetectObjects(grayscale, cascade, storage, 1.2, 2,    
                                cv.CV_HAAR_DO_CANNY_PRUNING,    
                                cv.cvSize(50, 50))#设置最小的人脸为50*50像素    
   
if faces:    
    print 'face detected here', cv.cvGetSize(grayscale)    
    for i in faces:    
        cv.cvRectangle(image, cv.cvPoint( int(i.x), int(i.y)),    
                     cv.cvPoint(int(i.x + i.width), int(i.y + i.height)),    
                     cv.CV_RGB(0, 255, 0), 1, 8, 0)#画一个绿色的矩形框   
    # detect objects
cascade = cv.cvLoadHaarClassifierCascade('haarcascade_frontalface_alt.xml',
cv.cvSize(1,1))
faces = cv.cvHaarDetectObjects(grayscale, cascade, storage, 1.2, 2,
cv.CV_HAAR_DO_CANNY_PRUNING,
cv.cvSize(50, 50))#设置最小的人脸为50*50像素
if faces:
print 'face detected here', cv.cvGetSize(grayscale)
for i in faces:
cv.cvRectangle(image, cv.cvPoint( int(i.x), int(i.y)),
cv.cvPoint(int(i.x + i.width), int(i.y + i.height)),
cv.CV_RGB(0, 255, 0), 1, 8, 0)#画一个绿色的矩形框 

步骤三:用highgui画出视频窗口
highgui.cvNamedWindow ('camera', highgui.CV_WINDOW_AUTOSIZE)    
highgui.cvMoveWindow ('camera', 50, 50)    
   
highgui.cvShowImage('camera', detimg)   
    highgui.cvNamedWindow ('camera', highgui.CV_WINDOW_AUTOSIZE)
highgui.cvMoveWindow ('camera', 50, 50)
highgui.cvShowImage('camera', detimg)  




由于视频流是动态的,所以我们可以在程序的入口中使用一个无限循环,在循环中,每次从视频中读入一个帧,将这个帧传输给人脸检测模块,检测模块在这个帧上进行标记(如果有人脸的话),然后返回这个帧,主程序拿到这个帧后,更新显示窗口。
opencv的其他特性
拉普拉斯边缘检测
 

def laplaceTransform(image):    
    laplace = None   
    colorlaplace = None   
    planes = [None, None, None]    
   
    image_size = cv.cvGetSize(image)    
    if not laplace:    
        for i in range(len(planes)):    
            planes[i] = cv.cvCreateImage(image_size, 8, 1)    
        laplace = cv.cvCreateImage(image_size, cv.IPL_DEPTH_16S, 1)    
        colorlaplace = cv.cvCreateImage(image_size, 8, 3)    
   
    cv.cvSplit(image, planes[0], planes[1], planes[2], None)    
   
    for plane in planes:    
        cv.cvLaplace(plane, laplace, 3)    
        cv.cvConvertScaleAbs(laplace, plane, 1, 0)    
   
    cv.cvMerge(planes[0], planes[1], planes[2], None, colorlaplace)    
    colorlaplace.origin = image.origin    
   
    return colorlaplace   
def laplaceTransform(image):
laplace = None
colorlaplace = None
planes = [None, None, None]
image_size = cv.cvGetSize(image)
if not laplace:
for i in range(len(planes)):
planes[i] = cv.cvCreateImage(image_size, 8, 1)
laplace = cv.cvCreateImage(image_size, cv.IPL_DEPTH_16S, 1)
colorlaplace = cv.cvCreateImage(image_size, 8, 3)
cv.cvSplit(image, planes[0], planes[1], planes[2], None)
for plane in planes:
cv.cvLaplace(plane, laplace, 3)
cv.cvConvertScaleAbs(laplace, plane, 1, 0)
cv.cvMerge(planes[0], planes[1], planes[2], None, colorlaplace)
colorlaplace.origin = image.origin
return colorlaplace  


结束语
OpenCV的功能十分强大,而且提供了大量的算法实现,文中涉及到的内容只是计算机视觉中很小的一部分。读者可以考虑将采集到的人脸进行标识,从而实现特定人的人脸识别。或者考虑将人脸检测移植到网络上,从而实现远程监控。试想一下,原来没有生命的机器,我们可以通过自己的思想,动作来使得它们看起来像是有思想一样,这件事本身就非常的有趣。
出处
http://www.360doc.com/content/10/0225/20/617416_16819007.shtml

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值