前言
这个去年就会的知识因为很久没用已经快忘了,以前没写总结,于是今天要用到的时候又必须重新学一遍。因为网上的多数教程实在过于琐碎,于是总结一篇精炼的文章以便复习。
PCA
考虑 n n n个 m m m维特征: X = ( x 1 , . . . , x n ) X=(x_1,...,x_n) X=(x1,...,xn)。(一列为一个特征,一行为所有特征在某一维的坐标,一定要区分清楚),先将其每维度特征减去平均值。
得到每个维度的协方差矩阵: C x = X X T C_x=XX^T Cx=XXT。
以前的基为 ( e 1 , . . . , e m ) (e_1,...,e_m) (e1,...,em),想找到一组新的基 ( η 1 , . . . , η m ) (\eta_1,...,\eta_m) (η1,...,ηm),得到新的特征矩阵 Y = Q X Y=QX Y=QX( Q Q Q为 e e