前言
2021寒假,机器学习随笔
PCA简介
主成分分析(Principal Component Analysis)是一种非监督方法,不使用输出信息;需要最大化的准则是方差。主成分是这样的 ω \omega ω,样本投影到 ω \omega ω上之后最分散,使得样本点之间的差别最明显,也就是方差最大。
原理过程
为了得到为一解且是的该方向成为最重要的因素,我们要求 ω 1 \omega_1 ω1的范数等于1 。如果 z 1 = ω 1 T x {z_1} = {\omega_1 ^T}x z1=ω1Tx且Cov( x x x) = Σ \ \Sigma Σ,则 V a r ( z 1 ) = ω 1 T Σ ω 1 Var\left( { {z_1}} \right) = {\omega_1 }^T\Sigma {\omega_1 } Var(z1)=ω1TΣω1其中 Σ \ \Sigma Σ表示样本的协方差矩阵。我们要寻找一个 ω 1 \omega_1 ω1,使得 V a r ( z 1 ) Var\left( z_1 \right) Var(z1)在 ω 1 T ω 1 = 1 {\omega_1 ^T}\omega_1 = 1 ω1Tω1=1的条件下最大化。把这个写成一个拉格朗日问题。 max ω 1 ω 1 T Σ ω 1 − α ( ω 1 T ω 1 − 1 ) \mathop {\max }\limits_{ {\omega _1}} {\omega _1}^T\Sigma {\omega _1} - \alpha \left( { {\omega _1}^T{\omega _1} - 1} \right) ω1maxω1