先介绍一下奇异值分解,也称为谱分解
A
=
U
Σ
V
T
A = U\Sigma V^T
A=UΣVT
这里
U
U
U称为左奇异向量,
V
V
V称为右奇异向量,
Σ
\Sigma
Σ为奇异矩阵。
奇异值分解常常用来做低秩逼近,也就是保留最大的前r个奇异值以及特征向量,作为在秩为r时的最佳逼近
T
=
A
V
=
U
Σ
=
[
t
1
,
…
,
t
r
]
A
r
=
t
1
v
1
T
+
⋯
+
t
r
v
r
T
=
λ
1
u
1
v
1
T
+
⋯
+
λ
r
u
r
v
r
T
T = AV =U\Sigma= [t_1,\dots,t_r] \\A_r = t_1v_1^T+\dots+t_rv_r^T=\lambda_1u_1v_1^T+\dots+\lambda_ru_rv_r^T
T=AV=UΣ=[t1,…,tr]Ar=t1v1T+⋯+trvrT=λ1u1v1T+⋯+λrurvrT
λ
\lambda
λ为奇异值,
T
T
T为得分矩阵,我们可以看到奇异分解的特殊性,那就是V即使权值矩阵,又是载荷矩阵,这是因为V满足如下特点
v
i
T
v
j
=
{
0
i
≠
j
1
i
=
j
v
i
T
A
T
A
v
j
=
{
0
i
≠
j
λ
i
2
i
=
j
v_i^Tv_j = \left\{\begin{matrix} 0& i\neq j\\ 1&i = j \\ \end{matrix}\right. \ \ \ \ v_i^TA^TAv_j = \left\{\begin{matrix} 0& i\neq j\\ \lambda_i^2&i = j \\ \end{matrix}\right.
viTvj={01i=ji=j viTATAvj={0λi2i=ji=j
由此,我们可以看到,当
i
≠
j
,
v
i
T
v
j
=
v
i
T
A
T
A
v
j
=
t
i
T
t
j
=
0
i \neq j,v_i^Tv_j=v_i^TA^TAv_j=t_i^Tt_j=0
i=j,viTvj=viTATAvj=tiTtj=0,
v
i
v_i
vi和
v
j
v_j
vj既正交又共轭。
好了,下面可以看看偏最小二乘法的w和p,为何两者是不同呢,原因是如果w=p,那么无法保证
t
i
t_i
ti和
t
j
t_j
tj正交
以下均假定
i
≠
j
i \neq j
i=j
为了简化问题,只讨论在单变量的情况,存在如下关系
w
i
=
X
i
−
1
T
y
/
∣
∣
X
i
−
1
T
y
∣
∣
t
i
=
X
i
−
1
w
i
w
i
T
w
j
=
0
w_i = X_{i-1}^Ty/||X_{i-1}^Ty||\\ t_i = X_{i-1}w_i\\ w_i^Tw_j = 0
wi=Xi−1Ty/∣∣Xi−1Ty∣∣ti=Xi−1wiwiTwj=0
假设
w
=
p
w=p
w=p,则有
X
i
=
X
i
−
1
−
t
i
w
i
T
X_{i} = X_{i-1}-t_iw_i^T
Xi=Xi−1−tiwiT
考查
t
1
t_1
t1和
t
2
t_2
t2之间的关系
t
1
T
t
2
=
w
1
T
X
0
T
X
1
w
2
=
w
1
T
X
0
T
(
X
0
−
t
1
w
1
T
)
w
2
=
w
1
T
X
0
T
X
0
w
2
t_1^Tt_2 = w_1^TX_0^TX_1w_2=w_1^TX_0^T(X_0-t_1w_1^T)w_2 =w_1^TX_0^TX_0w_2
t1Tt2=w1TX0TX1w2=w1TX0T(X0−t1w1T)w2=w1TX0TX0w2
按照前面的讨论,如果
w
1
w_1
w1和
w
2
w_2
w2属于
X
0
T
X
0
X_0^TX_0
X0TX0的特征向量的话,那么没问题。但是显然根据
w
i
w_i
wi的生成方式,并不满足这个条件。所以不能以此作为载荷。
按照最小二乘法得到
p
i
=
X
i
−
1
T
∗
t
i
/
(
t
i
T
t
i
)
p_i = X_{i-1}^T*t_i/(t_i^Tt_i)
pi=Xi−1T∗ti/(tiTti)
那么有
p
i
T
w
i
=
t
i
T
X
i
−
1
∗
w
i
/
(
t
i
T
t
i
)
=
1
p_i^Tw_i = t_i^TX_{i-1}*w_i/(t_i^Tt_i) = 1
piTwi=tiTXi−1∗wi/(tiTti)=1
由于
w
i
w_i
wi是单位向量,这意为着
p
i
p_i
pi在
w
i
w_i
wi上的投影为1,所有
p
i
=
w
i
+
w
i
⊥
p_i = w_i+w_i^\perp
pi=wi+wi⊥,
w
i
⊥
w_i^\perp
wi⊥表示正交于
w
i
w_i
wi的部分,这部分内容的增加使得
t
i
t_i
ti和
t
j
t_j
tj正交成立。