1、PCA的本质
协方差矩阵的对角化,KL变换,将特征值较大的保存下来。
给定一个矩阵
X∈Rm×n
X
∈
R
m
×
n
,例如
PCA的本质就是选择 k<m k < m 个正交基进行降维的同时又尽量保存原始的信息。即,使得 A A 变换到这组基后,使得行向量之间的协方差为0,而每个行向量的方差尽可能大。(这里一行代表一个数据,即使将多行的数据压缩成更少的行数,但是尽量保留了原始的信息,非对角元上的2个协方差代表行与行之间的相关性,所以相关性越小越好;对角元上的方差 1n∑ni=1a2i 1 n ∑ i = 1 n a i 2 、 1n∑ni=1b2i 1 n ∑ i = 1 n b i 2 越大越好)
2、协方差矩阵(对称半正定)
注意:这里的n是列数
3、PCA问题实例
假设
Y=QX
Y
=
Q
X
(
Q
Q
是方阵),则对角化,令
而
其中 U=[u1,...,un] U = [ u 1 , . . . , u n ] 是特征向量矩阵
所以,令
Q=UT
Q
=
U
T
实现对
CY
C
Y
的对角化。
(1)
其中, X X 是原始数据,根据公式 (2) ( 2 ) 计算得出。
(2)根据 CXx=λx C X x = λ x 得出 CX C X 的特征值: λ1=2,λ2=2/5 λ 1 = 2 , λ 2 = 2 / 5 ,所以特征向量为
因此,
所以,
此时,对角化了 CY C Y ,未降维。
(3)降维(2行数据降到1行数据,按照 λ λ 从大到小取)
这里取 Q Q 的第一行,即对应的第一列数据 u1 u 1 ,即对应着最大的 λ1=2 λ 1 = 2
总结:对数据 X X 的协方差矩阵进行变换(左边 Q Q ,右边以维持等式不变),变换过程得到 CY C Y 对角矩阵。即原始的数据 X X 经过变换过程也可以得到对角矩阵,此时的结果使得行与行之间相关性变小,对角元数据方差尽可能大。