http://blog.csdn.net/pipisorry/article/details/49235529
这个没时间写,下次有空写吧╮(╯_╰)╭
Anand.Rajaraman-Mining of Massive Datasets-mmds2014 11.2 Principal-Component Analysis
假设数据源是一系列的20幅图像,每幅图像都是 大小,那么它们都可以表示为一个 维的向量。将它们排成一个矩阵: 然后对它们进行PCA处理,找出主元。为什么这样做呢?据人脸识别的例子来说,数据源是20幅不同的人脸图像,PCA方法的实质是寻找这些图像中的相似的维度,因为人脸的结构有极大的相似性(特别是同一个人的人脸图像),则使用PCA方法就可以很容易的提取出人脸的内在结构,也及时所谓“模式”,如果有新的图像需要与原有图像比较,就可以在变换后的主元维度上进行比较,则可衡量新图与原有数据集的相似度如何。对这样的一组人脸图像进行处理,提取其中最重要的主元,即可大致描述人脸的结构信息,称作“特征脸”(EigenFace)。这就是人脸识别中的重要方法“特征脸方法”的理论根据。近些年来,基于对一般PCA方法的改进,结合ICA、kernel-PCA等方法,在主元分析中加入关于人脸图像的先验知识,则能得到更好的效果。
from: http://blog.csdn.net/pipisorry/article/details/49235529
Machine Learning - XIV. Dimensionality Reduction降维 (Week 8)