概述:
此文章将要描述一种基于MATLAB平台,运用PCA主成分分析方法对图片数据进行降维,运用SVM支持向量机分类器对降维后的图片数据进行分类处理,从而达到人脸识别的目的。
首先要感谢以下几篇文章的作者(后面引用会标识文章标号)
2.
PCA (主成分分析)详解 (写给初学者) 结合matlab(F),E篇列出了具体的数据供大家检验,大家可以根据数据来验证数学过程,简单易懂。F篇与前篇有点相似,对初学者很有帮助。
4.浅谈协方差矩阵(G)此篇文章对于大家了解协方差矩阵以及matlab实现很有作用。
准备:
1.编程平台:MATLAB。
首先你得保证你的机器上安装有matlab,建议较高的版本。
2.libsvm工具箱。
本人在对第一篇文章中代码关于SVM分类的部分没有运行成功,所以运用了libsvm工具箱对样本训练,测试,并没有运用第一篇文章的代码,如果你能成功可忽略,但建议安装此工具箱,其对SVM分类有很大帮助。如果你一样没有成功,这里推荐一个链接,有关于libsvm工具箱的安装配置的视频。
3.数据:ORL人脸库。
这个数据为已经预处理的数据,格式为pgm,属于Linux格式,windows环境下无法直接打开,可以在matlab中打开,打开方式imshow(imread('图片路径'));数据是400张人脸图片,属于40个人,每个人10张,每张大小112*92像素,数据下载地址在第一篇文章中有,这里也给个链接,第四段两个链接都可下载。
4.主成分分析法PCA。
主成分分析法是一种降维的方法,上面给出了几个有用的链接,本文只给出代码,以及代码说明,关于原理,大家尽可参照上面几个链接,写得非常详细也非常通俗。
5.SVM支持向量机分类器。
SVM支持向量机是一个二类分类器,但是本次人脸识别不仅只是分出两类,而是需要分出40个类别。本人以前有过一点机器学习基础,所以在支持向量机原理的理解上没有多大问题,如果读者没有SVM基础,可参考SVM入门(H),以及写的非常给力的帖子,SVM三层境界(I)。
注:也许很多初学者看到这么多的资料,链接都已经晕了,失去了学习的动力。先别灰心,稍后我会把代码以及代码运行的结果和过程展示给大家,当大家看到这些图像的变换的美妙,就会有学习的兴趣。
编程实现:
以下将要展示的是几个.m文件的代码,.m文件即是能在matlab上面打开运行的代码文件,可以在其中定义函数,如果matlab的当前路径指定在含有这些.m文件的文件夹中,运行时就可以调用这些文件中定义的函数。
首先展示第一个.m文件,便是图片数据读取函数ReadFace.m
function [f_matrix,realclass]=ReadFace(n_persons,flag)
%ORL人脸库。pgm格式的图片。40人,每人10幅图,图像大小为112*92像素。
%每个人有10幅照片,前5幅当作训练集,后5幅当作测试集
%
%输入变量flag:
% flag是一个标识变量
% 当flag为0时,表示输入为训练集,flag为1时,表示输入为测试集
%
%输入变量n_persons:
% n_persons标志着你想要识别的人脸个数
%
%输出变量realclass:
% realclass是一个n_person*5行,1列的列向量。
% realclass即是数据的标签,无论训练集测试集都进行了标签处理
%
%输出变量f_matrix:
% f_matrix是一个n_person*5行,112*92列的矩阵
% 每一行便是每一张图片的灰度数据