一、基本原理
Given m data points in n-dimensions, find p <= n
principal components that can be best used to generate the
transformed data
Data processing:
还原数据:
Snew=Sorg * P.transpose() * P +u
此处,Sorg为原始数据,u为原始数据均值。
一般对Snew还可以进行白化变换,降低不同特征之间的关联性,白化变换就是对每个特征进行方差归一化。
二、sklearn 中使用pca
pca=PCA(n_components=6)
newData=pca.fit_transform(train_faces)
print newData.