在模式识别领域中,PCA是一种常用的数据集降维手段,在此基础上,保留数据集中对方差贡献最大的特征从而进行模式分类。OpenCV中提供PCA的类,因此可以方便地使用PCA来进行人脸识别研究。在学习了网上的相关实现和代码,在以下开发平台跑通了代码:win8.1+OpenCV2.4.9+Qt5.3.2。
一、基本步骤
关于PCA的一些理论,可参照:http://blog.csdn.net/liyuefeilong/article/details/45126255 以下是实现PCA的基本思路:
1.把原始数据中每个样本用一个向量表示,然后把所有样本组合起来构成一个矩阵。这里为了避免样本单位对后续处理的影响,样本集需要标准化。
2.求样本的散布矩阵。事实上,散布矩阵是样本协方差矩阵的(n-1)倍,而协方差矩阵则表示不同随机变量之间的相互关系,在图像中则等价为求两个像素之间的关系。这里散布矩阵是实对称矩阵。
3.对第二步中得到的散布矩阵求相应的特征值和特征向量。
4.所谓主成分分析,即需要得到具有最大特征值的特征向量,所以我们需要将特征向量按照特征值由大到小排序并形成一个映射矩阵,并根据指定的PCA保留的特征个数取出映射矩阵的前n行或者前n列作为最终的映射矩阵。
5.用第四步的映射矩阵对训练样本数据进行映射,达到数据降维的目的。假设原始的图像数据是m*n的矩阵,只包含主成分的特征向量构成一个n*p的矩阵,其中每一列都是一个特征向量。将两个矩阵相乘,即可获得降维之后的图像矩阵m*p,这个矩阵远小于原始的图像数据。
6.同步骤五,读取所有测试集图像,并对其进行降维操作。如果测试集有M幅图像,则降维后的矩阵为M*p。
7.最后,对测试集进行模式识别。
在本次实验实现的过程中,需要用到opencv的这些函数,下面简单介绍下这些函数。
二、OpenCV中需要用到的几个函数
PCA::PCA(InputArray data, // 输入一个矩阵
InputArray mean, // 输出一个句子
int flags, // 输入矩阵数据的存储方式,有以下两种参数设定
// CV_PCA_DATA_AS_ROW:代表输入矩阵的每一行表示一个样本
// CV_PCA_DATA_AS_COL:代表输入矩阵的每一列表示一个样本
int maxComponents=0) // 计算PCA时保留的最大主成分的个数
// 该函数将输入数据投影到PCA主成分空间中去
// 返回每一个样本主成分特征组成的矩阵
cv::Mat PCA::project(InputArray vec) const
// 调用backProject函数前一般已经调用过project()函数
// 其作用可理解为project()函数的逆运算
// 函数的作用就是用vec来重构原始数据集(原理有待进一步了解)
cv::Mat PCA::backProject(InputArray vec) const
另外PCA类中还有几个重要的成员变量:
mean // 原始数据的均值
eigenvectors // 散布矩阵(协方差矩阵)的特征值
eigenvalues // 散布矩阵(协方差矩阵)的特征向量
三、相关代码
根据网上提供的代码,修改成可以在开发平台上使用的版本&#x