PCA新样本进行降维应该是,对于新样本 x x x,分别和 v 1 , v 2 v_1,v_2 v1,v2做内积,就可以得到在各个主成分方向上的权重,也就是投影坐标 y 1 , y 2 y_1,y_2 y1,y2
y
1
=
v
1
T
∗
x
y_1 = v_1^T*x
y1=v1T∗x
y
2
=
v
2
T
∗
x
y_2 = v_2^T*x
y2=v2T∗x
v 1 , v 2 v_1,v_2 v1,v2是特征向量
因为 v 1 , v 2 v_1,v_2 v1,v2都是单位向量,所以 v 1 T ∗ x v_1^T*x v1T∗x 内积就是相当于 y 的长度,就是投影坐标
%%%%%%%%%%% 作一个y=x,y=-x两个方向分布的数据集
>
A =
1.0000 1.0000
2.0000 2.0000
-1.0000 -1.0000
-2.5000 -3.0000
-3.0000 -2.5000
1.0000 0
0 1.0000
%%%%%%%%%%% 计算协方差矩阵
> C = 1/7*A'*A
C =
3.1786 3.0000
3.0000 3.1786
%%%%%%%%%%% 特征值特征向量分解
> [V,D] = eig(C)
V =
-0.7071 0.7071
-0.7071 -0.7071
D =
6.1786 0
0 0.1786
> v1 = [-0.7071
-0.7071]
v1 =
-0.7071
-0.7071
> v2= [0.7071
-0.7071]
v2 =
0.7071
-0.7071
%%%%%%%%%%% 给定一个新样本 x
> x = [5
5]
x =
5
5
%%%%%%%%%% 在v1方向上投影,就得到投影坐标 y1=ans=-7.0710
> v1'*x
ans =
-7.0710
>