及
(,)0,1,2,..., 1.T i k i k Cov Y Y l l k i =∑==-
下,求 l i 使 Var(Y i )达到最大,由此 l i 所确定的
T i i Y l X =
称为 X 1,X 2,…,X p 的第 i 个主成分。 1.2 总体主成分的计算
设 ∑是12(,,...,)T p X X X X =的协方差矩阵,∑的特征值及相应的正交单位化特征向量分别为
120p λλλ≥≥≥≥
及
12,,...,,p e e e
则 X 的第 i 个主成分为
1122,1,2,...,,T i i i i ip p Y e X e X e X e X i p ==+++= (3)
此时
(),1,2,...,,
(,)0,.
T
i i i i T
i k i k Var Y e e i p Cov Y Y e e i k λ?=∑==??=∑=≠?? 1.3 总体主成分的性质
1.3.1 主成分的协方差矩阵及总方差
记 12(,,...,)T p Y Y Y Y = 为主成分向量,则 Y=P T X ,其中12(,,...,)p P e e e =,且
12()()(,,...,),T T p Cov Y Cov P X P P Diag λλλ==∑=Λ=
由此得主成分的总方差为
1
1
1
()()()()(),p p
p
T
T
i
i
i i i i Var Y tr P P tr PP tr Var X λ
=====∑=∑=∑=∑∑∑
即主成分分析是把 p 个原始变量 X 1,X 2,…,X p 的总方差