1. PCA简要介绍
- 降维 —— 用新的基底表示(基变换)
- 求最大方差:用来确定主方向,使得投影后的数据尽量分散。
- 求协方差:使得新找的
轴
之间独立(不希望它们之间存在(线性)相关性的,因为相关性意味着两个字段不是完全独立),这样就不会存在重复表达的信息
。
- 零均值化 —— 方便后面的求协方差矩阵。—— 求的是同一个特征的平均值,就像 X ‾ \overline{X} X, Y ‾ \overline{Y} Y
- 协方差矩阵:包括
方差
和协方差
。—— 要会计算。
以二维向量
(X,Y)为例:
Q = ( V a r ( X ) C o v ( X , Y ) C o v ( X , Y ) V a r ( Y ) ) Q=\begin{pmatrix}Var(X)&Cov(X,Y)\\Cov(X,Y)&Var(Y)\end{pmatrix}\\ Q=(Var(X)Cov(X,Y)Cov(X,Y)Var(Y))- 协方差: C o n v ( X , Y ) Conv(X,Y) Conv(X,Y)
- 方差: V a r ( X ) Var(X) Var(X)
- 协方差矩阵对角化
- 获得特征值和特征向量
C = P Λ P T C = P\Lambda P^T C=PΛPT
C C C为协方差矩阵, P P P中每一列就是主元
, Λ \Lambda Λ为对角阵。
- 获得特征值和特征向量
2. PCA用处
- 特征脸