假设我们现在有n个样本,每个样本m个属性。
1、对所有样本进行中心化:求每个属性的均值,每个样本的每个属性 去减去该属性对应的均值。
2、计算样本的协方差矩阵(忘了协方差矩阵是什么?见http://blog.csdn.net/moon_down_wrp/article/details/77898654)
3、对协方差矩阵做特征值分解(实践中通常通过对样本矩阵X进行奇异值分解来代替协方差矩阵的特征值分解)
4、取最大的m'个特征值所对应的特征向量w1,w2,w3,...,wm'
5、投影矩阵即为W=(w1,w2,w3,...,wm')
6、xi样本对应的降维后的样本即为:W的转置*xi