人脸识别技术论文篇一
人脸识别技术综述
摘要:文章首先对人脸识别技术进行了介绍,其次回顾了人脸识别研究的发展历程及识别方法的基本分类,然后对当前主流的人脸识别方法展开了详细的论述,最后提出了人脸识别技术面临的问题及研究方向。
关键词:人脸识别;特征脸;线形判别分析;局部二值模式
中图分类号:TP391
Survey of face recognition technology
He Chun
(Education and Information Technology Center, China West Normal University, Nanchong Sichuan 637002, China)
Abstract: This paper introduces technology of face recognition firstly, and reviews the development process and the basic classification method of face recognition. After that, the paper discusses the current methods of face recognition in detail, therefore proposes the existing problems in the research of recognition faces and futures research direction.
Key words: face recognition; Eigenface; linear discrimination analysis; LBP
1 人脸识别技术简介
人脸识别,特指利用人脸视觉特征信息的分析比较结果进行身份鉴别的计算机技术[1]。一般人脸识别有广义和狭义之分,广义是指包含人脸图像采集、定位、预处理、身份确认与查找等在内的技术;而狭义仅指身份确认或查找系统。
通俗来讲,人脸识别指运用计算机分析人脸视频或图像之后,提炼可用、有益的识别信息,再对人脸对象的身份构建判断与识别。人脸识别是身份识别研究中最主要的一种方法,重点建立在生物识别技术基础之上,而且其中应用了诸多计算机相关的图形学、人工智能等最新技术手段。
人脸与人体的其他生物特征(指纹、虹膜等)一样与生俱来,其生物特征内在的稳定性和唯一性使其自然成为了身份识别的理想依据。学术界对人脸识别相关问题的研究已然趋近成熟,并形成了为数可观的研究成果,到目前为止,仍然在不断的探索与发展中,尤其在人脸身份识别方面的建树颇多。快速、直接、简捷是人脸识别系统的独有优势,并已广泛运用于刑事侦破、信息安全等方面。在此,本次研究将对人脸识别技术给出全面的解析论述。
1 人脸识别发展历程
早在20世纪50年代,心理学家即已着手对人脸识别展开研究,但是直至60年代,对人脸识别真正意义上的研究才正式开启,具体是从工程应用层面出发,研究得到一种半自动的人脸识别系统,这种系统具备的特点可描述如下:
一是该系统是对局部的识别,对人脸的几何特点识别,进而分析人脸器官特征信息及其之间的关系,优势在于识别手段简易、清晰,劣势在于一旦人脸的视角、表情等发生变动和变化,那么很难准确地得到识别效果;二是这种半自动的人脸图像识别需要较为严苛的约束环境和条件,如果图像存在单一或无背景的情况下,那么就将削弱最终的处理效果。
研究递进到20世纪90年代以后,即已朝着整体和局部相结合的态势演变。学者们认为需要将人脸的形状拓扑结构、局部灰度和全局灰度分布等多项人脸特征信息相结合,才能全面、准确地实现人脸图像识别。1991年,Turk和Pentland [2]、首次提出著名的特征脸(Eigenface)方法,利用主成分分析(Principal Component Analysis,PCA)取得了不错的识别效果;Belhumer在其论文中,则将Fisher判别准则成功应用到了人脸分类当中,由此而提出Fisherface方法[3]。
此后,这种应用线性子空间和统计特征的技术就已成为当时大众化流行的识别技术,可概括为利用成分分析、线性判别分析的特征识别手段。后期出现了基于机器学习理论的实用技术,学者们相继探索出遗传算法、支持向量机等方法对人脸进行识别。
2 人脸识别方法分类
研究可知从不同的角度,人脸识别可有不同的分类方法,本次研究根据人脸识别发展阶段的特征,把人脸识别技术分为初始以几何特征为基础、中期以代数特点为依据、后期以机器学习理论为原理三种。下面即对这3类研究给出功能实现概述。
2.1 以几何特征为基础的研究
这种方式是将人脸用一个几何特征矢量予以有效表示,并根据模式识别中层次聚类的思想设计分类器,达到识别目的。识别所采用的几何特征是以人脸器官的形状和几何关系为基础的特征矢量,本质上是特征矢量之间的匹配,相应分量通常包括人脸指定2点间的欧式距离、曲率、角度等[4]。
该类研究方式优点是简单易懂,但是由于能量函数中加权系数的选择表现出一定的经验性,并未能形成规范统一的特征提取标准;而且图像稳定的特征提取仍有难度,尤其是特征受阻时;另外,对于明显的表达变化或不良的姿势变化,其鲁棒性均呈低弱。
2.2 以代数特点为依据的研究
这种方式往往基于代数特征图像的像素变换投影空间,具有某种数量的基本图像对人脸图像线性编码,典型的理论工作可首推主成分分析方法。
主成分分析方法早期是由Sirovitch和Kirby[5]引入人脸识别领域,并将其用于分析数据,过程中是使用数量少的特点来描述为了降低特征空间维数的样本,而且是基于K-L来展开和实现的。 2.3 以机器学习理论为原理的研究
由2.1节中的研究方式可知,人脸特征是预先定义形成的。本节讨论的方式,则是通过使用统计分析和机器学习技术,从中获取信息。获得的信息存在于确定的分布之中,并通过算法、模型和判别函数,用作人脸图像识别。这种分类器是时下至关重要的一门技术,而且涵盖了SVM、Hidden Markov模型与AdaBoost算法等在内的综合开发系统技术。
3 人脸识别主流方法介绍
3.1 特征脸方法
人脸方法来自主成分分析的人脸识别和描述技术。这种方法主要是把图像区域当作随机变量,运用K-L转变成为正交K-L基,与较大特征值相关的对应基具有与人脸相似的形状,所以也可称做特征脸。使用这种线性组合能够描述、展现近似的人脸图像、人脸识别以及合成。具体表现为把人脸图像映射到人脸子空间之上,同时对人脸图像在特征脸子空间上的方位进行对比。
3.1.1 人脸空间的建立
研究假设人脸图像包含了众多像素点,并且可用N维向量来表示,那么样本库就可用i(i=1,...,M)提供应用表达[6] 。人脸空间的基向量由协方差矩阵C的正交特征向量构成,因此称为特征脸。
把特征值由大到小排列:12...r ,其对应的特征向量为k。在此条件下,不同的人脸图像都能投影到由u1, u2, ..., ur组成的子空间中。结果就是不同的人脸图像将映射为子空间中不同的点,反之亦然。
3.1.2 特征向量的选取
协方差矩阵所生成的非零特征值的k(k远小于M)个特征向量,一般来说k值比较大,但在常规情况下并非需要保留所有有的特征向量。因为投影的计算速度是同子空间向量数有着密切关联,如果能够考虑到时间限度,就能够提取有效信息的特征向量。
3.1.3 预测识别
人脸图像置其投影可得到一组坐标系数,该系数能够表明图像在子空间中的位置,因而可以作为人脸识别的基础。换言之,每一幅人脸图像皆能显示出线性组合的人脸,加权系数为K-L变换的扩展系数,也能作为图像的代数特征。所以,提取特征脸信息后,可向对方典型样本进行投影,并将得到的投影特征映射到各研究人脸的特征向量,作为后续识别匹配搜索空间的一个步骤。 图1~图3给出了不同情况下的特征脸图像。
3.2 线性判别分析法
线性判别分析,可简称为LDA,本质是多维模式空间到一维特征空间的映射,使用类的成员信息形成一组特征向量,构建得到的特征空间称为Fisherface。在理论上,这种方式主要是利用类之间的散射矩阵类中的训练样本和基于散射矩阵的最优投影空间。和人脸识别方式比较,该种模式能够抑制不确定图像间的差异信息,并可以进一步提取利于识别的特征,因而具有较好的识别性能。
Lades等人认为人脸图像皆有相似的拓扑结构,提出了关于建立在动态连接结构的弹性图匹配方式基础上的物体识别问题。每节点涵盖40个小波系数,集合称为射流,对小波系数进行原始图像和一组5个频率,8个方向的Gabor小波卷积。所以每一张图像,就像标签被逐一校准,而边缘之间的距离则是通过点来设计校准。因此,针对图中边缘编码后得到的是人脸的几何形状,而图中节点编码后的结果是灰度值的分布。实现过程示意如图4所示。
由图4可知,弹性图匹配的意义在于寻找新的人脸,同时提取一张图像,图像类似于束图,用其可以开展识别工作。当开始识别的时候,计算、测量人脸和目前束图之间的相似性,具有最大相似性的面部实体就指明了测试人脸的身份。
3.3 局部二值模式
局部二值模式(Local Binary Pattern, LBP)是执行纹理描述的最佳方法之一, 并已在于各类应用软件中获得全面功能发挥,同时经由实践证得该模式具备着强大的判别能力、计算效率及不变形单调灰度水平变化等显著优势[7],因而可将其应用到不同复杂程度的图像分析任务之中。
3.3.1 基本LBP算子
LBP算子最初是界定于33邻域,将中心像素设置成阈值,并将灰度值与其建立对比,大于中心像素时就记1,反之记0。这时的8个点就能变换为一种8位没有符号的二进制数,此二进制数再转换为十进制数,也就是窗口的LBP值。LBP可整体反馈出区域的纹理信息。基本的LBP算子如图5所示。
LBP能够用邻域的大小不同,采用圆形面积与双线性插值,邻域半径R和P的像素数能任意选择,用符号(p,r)表示像素区域。常见的LBP算子参见图6。
3.3.2 LBP人脸描述
使用LBP手段描述人脸,具体表现为运用纹理描述符对人脸局部展开详细的绘制处理,然后将其组合成一体。人脸图像就被分割成几个局部区域,从这些不同的区域提取纹理描述符,并共同构成人脸的整体视图。
把脸部区域分成确定的m份R0、R1、R2、、Rm-1,直方图将依序计算每个区域,M的直方图计算结果整合在一起形成空间,空间增加MN大小的直方图,其中的n表示一个直方图的大小。空间增强的直方图可以有效地描述3个不同层次的脸部,具体的3个层次分别为:直方图LBP标识包含一个像素级别的信息;地域级是由小的区域上的标志结合构成的;这些区域的直方图连接起来,最终形成完整的人脸。
4 人脸识别技术面临的问题
人脸识别技术存在独有优势和广阔前景,但同时却也面临一定问题,而这些问题是却均是源起于人脸具备的生物特征的某些显性表象。人脸在视觉上的特点可实际剖析如下:
一方面由于个体间差别较小,人脸、人体器官构成也比较类似,虽然对人脸定位是占优势的,而对区别个体却产生干扰;另一方面,人脸的表情变化产生的视觉图像也会导致差异。此外,人脸图像识别时还会受到其他约束条件影响,比如光照、年龄、遮盖物等。因此,解决上面提及的各类问题则既是创新,也是挑战,更是人脸识别技术开展未来研究的后续发展方向。
参考文献:
[1] 吴巾一,周德龙. 人脸识别方法综述[J]. 计算机应用研究, 2009, 26(9): 3205-3209.
[2] TURK M, PENTLAND A. Eigenfaces for recognition [J]. Journal of cognitive neuroscience, 1991, 3(1): 71-86.
[3] BELHUMEUR P N, HESPANHA J P, KRIEGMAN D. et al. fisherfaces: Recognition using class specific linear projection [J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1997, 19(7): 711-720.
[4] BARTLETT M, LADES H, SEJNOWSKI T. Independent component representations for face recognition[C]//Proceeding of the SPIE Symposium on Electronic Imaging: Human Vision and Electronic Imaging . San Jose, CA:IEEE, 1998, 3299:528-539.
[5] KIRBY M, SIROVICH L. Application of the Karhunen-Loeve procedure for the characterization of human faces [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990, 12(1):103-108.
[6] SAMARIA F, YOUNG S. HMM based architecture for face identification [J]. Image and Computer Vision, 1994, 12(8): 537-543.
[7] AHONEN T, HADID A, PIETIKAINEN M. Face description with local binary patterns: Application to face recognition [J]. IEEE Trans. Pattern Anal. 2006, 28(5): 2037-2041.
点击下页还有更多人脸识别技术论文
人脸识别技术论文篇二
人脸识别中的图像预处理技术
摘要:人脸作为一种高普遍性、非接触式采集的重要生物特征,正被越来越多地用来进行身份鉴别。本文介绍了人脸识别的基本过程,简要分析了人脸识别中的图像预处理技术,如直方图变换、线性滤波、非线性滤波、图像变换,并在MATLAB中实现。
关键词: 人脸识别;傅里叶变换;中值滤波;图像处理;MATLAB
中图分类号:TP391.4 文献标识码:A
1引言
人脸识别,特指利用分析比较人脸视觉特征信息进行身份鉴别的计算机技术。人脸识别技术应用广泛,可用于安全验证系统、医学、档案管理、银行和海关的监控系统及自动门禁系统等[1]。与利用指纹、虹膜等其他人体生物特征进行身份识别的方法相比,人脸识别更加友好、方便和隐蔽。因其巨大的应用前景,以及其无可比拟的优越性,人脸识别越来越成为当前模式识别和人工智能领域的一个热点。图像预处理是人脸识别过程中的一个重要环节。输入图像由于图像采集环境的不同,往往存在有噪声,对比度不够等缺点。为了保证人脸图像中人脸大小、位置以及人脸图像质量的一致性,必须对图像进行预处理。
2人脸识别的基本内容和过程
人脸识别(Face Recognition)一般可描述为:给定一静止或动态图像,利用已有的人脸数据库来确认图像中的一个或多个人。从广义上讲,其研究内容包括以下五个方面:
(1)人脸检测(Face Detection):即从各种不同的场景中检测出人脸的存在并确定其位置。这一任务主要受光照、噪声、头部倾斜度以及各种遮挡的影响。
(2)人脸表征(Face Representation):即确定表示检测出的人脸和数据库中的己知人脸的描述方式。通常的表示方法包括几何特征(如欧氏距离、曲率、角度等)、代数特征(如矩阵特征矢量)、固定特征模板、特征脸、云纹图等。
(3)人脸鉴别(Face identification):即通常所说的人脸识别,就是将待识别的人脸与数据库中的已知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式与匹配策略。
(4)表情分析(Facial expression Analysis):即对待识别人脸的表情进行分析,并对其加以分类。
(5)物理分类(Physical Classification):即对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息。
人脸识别的基本过程和框架如图1所示。
人脸图像采集预处理特征提取识别
预处理模块主要完成人脸图像质量的改善,包括提高图像对比度、消除噪声等,可视具体应用而选用。特征提取模块完成提取人脸特征,如何提取稳定和有效的特征是识别系统成败的关键。本文将分析人脸识别中涉及的图像处理技术。
3人脸识别中的图像预处理技术
预处理的目的是为了提高图像质量、加强有用的信息。常用的预处理有姿态矫正、光照补偿、尺寸归一化、去噪、边界增强、提高对比度等,它是一项基础性工作,可在人脸特征提取之前根据需要有选择地进行适当的预处理操作。本文采用直方图均衡技术进行人脸图像的预处理,主要目的是增强对比度,提高图像质量。
3.1直方图均衡技术
3.1.1直方图定义
直方图是图像的一种统计表达。对一幅灰度图像,其灰度统计直方图反映了该图中不同灰度级出现的统计情况[2]。其定义为:
P(sk)=nk/N
其中nk表示图像的第k级灰度值,N表示像素总数。直方图能给出该图像的整体描述,例如图像的灰度范围、每个灰度级的频度和灰度的分布、整幅图像的平均明暗和对比度。直方图又分为直方图均衡化和直方图规定化。
3.1.2直方图均衡技术
直方图均衡化也叫直方图均匀化,就是把给定图像的直方图分布改变成均匀分布的直方图,它是一种常用的灰度增强方法[3]。本文在MATLAB环境下对采集后的图像进行了图像的预处理,见图2。
有些细节不够清晰,反映在直方图上就是其直方图所占据的灰度范围分布在较窄的区间,引起图像细节不清楚。图2(b)和图2(c)分别为对原始图像进行直方图均衡化得到的结果及其对应的直方图,由图2(c)可见均衡化后直方图占据了整个灰度值允许的范围,图像的灰度间距拉开,灰度分布均匀,从而增大了反差,使图像细节清晰,达到了图像增强的目的。
3.2线性平滑滤波
均值滤波也称为线性滤波,其采用的主要方法为邻域平均法、超限像素平滑法和加权均值滤波法。这里以邻域平均法为例进行说明。邻域平均法,其基本原理是用均值替代原图像中的各个像素值,即对待处理的当前像素点 (x,y)选择一个模板(图3所示为一均值滤波模板)求模板中所有像素的均值,再把该均值赋予当前像素点 (x,y),作为处理后图像在该点上的灰度g(x,y)。模板运算的基本步骤为:将模板在图像中漫游,并将模板中心与图像中的某个像素位置重合;将模板上系数与模板下对应的像素相乘;将所有乘积加起来;将和(模板的输出响应)赋给图像中对应模板中心位置的像素。图4所示为在MATLAB中对含噪图像图4(a)进行均值滤波的效果图,从图4(b)中可以发现达到了去噪效果。
3.3非线性平滑滤波
非线性平滑滤波的典型方法为中值滤波。中值滤波器的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围像素灰度值的差比较大的像素改取与周围的像素值接近的值,从而可以消除孤立的噪声点。图5所示为在MATLAB中采用不同的中值滤波模板对含噪图像如图5(a)进行中值滤波的效果图。对比5图(b)和(c)可以得到,5*5的模板去噪效果比3*3的模板效果好。
3.4图像变换
图像变换就是把图像从空间域转换到变换域(如频率域)的过程。将图像转换到新的空间,显现出一些新的特性,方便特征提取,使图像处理过程更加简单有效。图像变换的方法很多,如:离散傅里叶变换、离散余弦变换、哈达玛变换、小波变换等。其中傅里叶变换是一种较为典型的频域变换技术。利用二维离散快速傅里叶变换将人脸图像从空间域变换到频率域后,较为复杂的人脸图像可以简单地用振幅谱来表征,人脸图像在频率域中,计算简便,能量相对集中。
在变换域中实现图像增强的步骤如下:
(1)计算需增强的图像的傅里叶变换F(u,v);
(2)将其与一个(根据需要设计的)转移函数H(u,v)相乘;
(3)再将结果G(u,v)傅立叶反变换得到增强的图像。
以傅里叶变换为例,介绍其在频域中实现平滑滤波。在MATLAB中实现从空域到变换域的代码如下:
f=fft2(image);%将image图像进行快速傅里叶变换
g=fftshift(f);% 将傅里叶变换结果进行移中
由于边缘和噪声都对应图像傅里叶频谱中的高频部分,所以通过在频域中的低通滤波可以除去或消弱噪声的影响。要实现低通滤波首先需要选择一个合适的转移函数H(u,v)。在诸多低通滤波器中,Buterworth低通滤波器振铃现象不明显,而且能够提高图像的细节清晰度,这里以Buterworth低通滤波器为例对图像进行平滑滤波。一个阶为n,截断频率为D0的巴特沃斯低通滤波器的转移函数为:
H(u,v)=11+[D(u,v)/D0]2n待处理图像如图6(a)所示,从该图中可以看出图像中有噪声的干扰,Buterworth低通滤波器设置如下:n=3,截断频率为20。图6(b)所示为低通滤波效果图。
对比图6(a)和(b)可以发现,Buterworth低通滤波器对噪声的滤除效果很好,不过同时也使图像变得模糊了。
4总结
人脸识别具有无可比拟的优越性,近几十年来得到飞速发展,比如近年来出现了基于近红外图像的人脸识别,许多有效实用的人脸识别系统也脱颖而出,并且被广泛应用于海关、机场、金融机构等安全性要求较高的重要场所。人脸识别有着广阔的应用前景,不仅是模式识别、计算机视觉和人工智能等领域的一个热门的研究课题,同时,人脸识别又是一个难度极大的课题,如人脸识别中的光照问题,姿态问题,表情问题等,这也是作者进一步研究的重点。
参考文献
[1]董火明,高隽,汪荣贵.多分类器融合的人脸识别与身份认证[J].系统仿真学报, 2004(8).
[2]章毓晋.图像处理(第二版)[M].北京:清华大学出版社,2006.
[3]张宏林. 数字图像模式识别技术及工程实践[M].北京:人民邮电出版社,2003.