PCA(principal Component Analysis) 主成分分析
本文解决以下疑问:
1、什么是PCA?
2、为什么要求最大特征值?
3、为什么要投影到对应的特征向量?
——————————————————————————————————————————
1、什么是PCA?
有两种经常使⽤的PCA的定义,它们会给出同样的算法。这里讲第一种定义。
PCA可以被定义为数据在低维线性空间上的正交投影,这个线性空间被称为主⼦空间(principal subspace),使得投影数据的⽅差被最⼤化(Hotelling, 1933)。等价地,它也可以被定义为使得平均投影代价最⼩的线性投影。平均投影代价是指数据点和它们的投影之间的平均平⽅距离(Pearson, 1901)
2、为什么要求最大特征值?