摘 要 PCA是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题,对于某些复杂数据就可应用主成分分析法对其进行简化。计算主成分的目的是将高维数据投影到较低维空间。文中介绍了PCA算法的基本概念和基本原理,利用算法在降维和特征提取方面的有效性,结合人脸识别的实例进行详细的阐述。最后,文中还指出了PCA的优缺点,以及应用。
关键词 PCA;降维;特征提取;人脸识别
1 引言
PCA是Principal component analysis的缩写,中文翻译为主成分分析,是一种常用的数据分析方法。它是研究如何通过原来变量的少数几个线性组合来解释随机向量的方差-协方差结构,是数据压缩和特征提取中一种多维向量的统计分析方法。这种方法可以有效的找出数据中最“主要”的元素和结构,去除噪音[]和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。它的优点是简单,而且无参数限制,可以方便的应用与各个场合。因此应用及其广泛,从神经科学到计算机图形学都有它的用武之地,被誉为线性代数最有价值的结果之一。
2 PCA算法
2.1 PCA算法原理
PCA算法的基本思想是设法将原来众多具有一定相关性的指标(比如p个指标),重新组合成一组新的互相无关的综合指标来来代替原来的指标。通常数学上的处理就是将原来p个指标做线性组合,作为新的综合指标。典型的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示