最近用matlab做的一个简单的人脸识别,代码非原创,忘了从哪里找到的了,修改了一部分之后,代码可运行,详见我的资源。效果图如下:
1.数据采集
本文选择的人脸数据是英国剑桥大学的ORL人脸数据库是英国剑桥大学的ORL人脸数据库。下载址:
http://www.cl.cam.ac.uk/Research/DTG/attarchive/pub/data/att_faces.tar.Z
该数据库由40个人的400幅人脸图像构成,图像的分辨率为112*92的灰度图。人脸的面部表情和细节均有很大的变化,例如笑与不笑,眼睛睁着或不戴眼镜等;人脸姿态也有很大的变化,其深度旋转和平面旋转可达20度,人脸尺寸的也有最多的10%的变化。
2.数据预处理
了保证所有的人脸在图像中的大小、位置和偏斜的不变性,需要去除头发、脖子、肩膀及图像背景等与人脸无关的部分。在特征提取前必须对人脸图像进行几何归一化处理。
具体包括:
1)人脸图像旋转:保证了人脸方向上的一致性,也就保持图1中的ErEl水平
2)人脸图像剪裁:人脸位置的一致性,按图1中的比例剪裁人脸图像
3)图像尺度变换:保证人脸大小的一致性,把人脸图像缩放到32*32大小。
相关代码:procORL.m
3.特征提取
这里的选取图像的(x,y)点的灰度值做为特征值I(x,y),为了后面算法的方便,把I(x,y)变为一维列向量:X=(x1,x2,…,xn),对于32*32=1024个像素点的人脸图像由维变到一维的特征数量就是1024个。
相关代码:getfacedata.m
4.PCA主成分分析
本文选取的是ORL库中5个人的10张人脸图像,其中从每人中抽取5张作训练图像,其余5张做测试图像。那么训练集,跟测试集都有25张人脸图像。根据模式识别的有关理论,所选取的训练图像应该远大于特征数1024个。在样本数量远小于图像特征数的情况下,过多的特征数会导致峰值现像,也就是使识别错误变大。所以我们这里要通过PCA主成分分析法降维。PCA方法能够生成有用的特征,并且使生成的特征不相关,从而达到降维的目的。
本文1024维的特征向量经过PCA主成分分析后变为11维的特征向量,些时11维的特征向量对识别的贡献率已经达90%以上。
相关代码:pcapro.m
5.待测人脸图像识别
识别方法通过计算待测人脸图到培训人脸图像集的距离进行识别,也就是计算PCA反回后的11维向量间的距离d(X,Y) = sqrt((X-Y).^2);
6.结论
PCA的能够对高维线性数据进行降维,在PCA主成分分析能有效的对人脸进行识别。
备注:本文的提供的代码已经存储了相应的归一化的培训、测试集,跟生成了相应的PCA分析返回的向量,协方差矩阵。故把下面的代码进行了注释
% imglist = readFolderOrl(direct,'*.pgm');%读取orl库中的人脸图片路径
% tr_orl(imglist,tr_face);%提取培训集
% tt_orl(imglist,tt_face);%提取测试集
% imglist =readFolderOrl(tr_face,'*.jpg');%培训集中的人脸图片路径
% tr_facedata = getfacedata( imglist );%获取培训集中的人脸图片数据
% save tr_facedata; %存储数据
% imglist =readFolderOrl(tt_face,'*.jpg');%测试集中的人脸图片路径
% tt_facedata = getfacedata( imglist );%测试集中的人脸图片数据
% save tt_facedata; %存储数据
% [pc,latent,mixedisg]= pcapro(sample,rate);%PCA分析,只要做一次就够了,要点时间
% save pc; %PCA分析返回的特征向量
% save mixedisg;%协方差矩阵
直接运行代码中的test.m就可以了。