今天重新认识了一下用PCA 进行人脸识别,为什么要用主成分分析。
首先,来了解什么是方差。方差即为:差,方,和,均。差是减法,方是平方,和是加法,均则是出发,就是求差,方的均值。方差实际就是计算差值平均。均值反映的是平均水平,方差反映的是波动的水平。方差越大,数据波动越大,方差越小,数据波动越小。
然后我了解了一下协方差矩阵和相关矩阵的区别协方差矩阵的优势效应表现在单个指标方差大,指标之间相关程度高以及指标数多的一类指标上。而相关系数矩阵主要的优势表现在指标之间相关程度高以及指标数多的一类指标上。所以当单个指标的方差对研究起关键作用时,那么用协方差矩阵分析主成分比较好。协方差反应的是个体对事物的认识差异较大的,比如说人脸识别中,用协方差计算出的主成分反应的就是不同人脸的差异部分。如果研究的目的变了,单个指标的方差并不反映指标的重要性。我们就不能考虑用协方差矩阵了。
相关系数矩阵就是随机变量标准化后的协方差矩阵,通过随机变量的标准化,相关系数矩阵剥离了单个指标的方差,仅仅保留了指标间的相关性,用相关系数矩阵计算主成分,主要的优势表现在指标之间相关程度高以及指标数多的一类指标上。通过个体的认识来综合反应指标的重要性,那么用相关系数矩阵来表示主成分。