统计学习精要 (Elements of Statistical Learning ) 习题 3.20
问题:Consider the canonical-correlation problem (3.67). Show that the leading pair of canonical variates
u1
and
v1
solve the problem
a generalized SVD problem. Show that the solution is given by u1=(YTY)−12u∗1 , and v1=(XTX)−12v∗1 , where u∗1 and v∗1 are the leading left and right singluar vectors in
Show that the entire sequence um,vm,m=1,…,min(K,p) is also given by (3.87).
思路:
The problem (3.67) 在 84 页,问题是找到uncorrelated的
Xvm
和
Yum
使得下式被逐步最大化:
假设X和Y已经中心化了(centralized)我们可以得到
如果替换
u1=au1
,
v1=bv1
,
a,b
是实数,上式不变。因此我们可以固定
uT1YTYu1=1
及
vT1XTXv1=1
,且正负号无关,原问题变成
再定义
u∗1=(YTY)12u1
和
v∗1=(XTX)12v1
,代入上式
因此, u∗1 和 v∗1 是 (YTY)−12(YTX)(XTX)−12 的最大的奇异值对应的左右奇异向量,且 u∗m m=1,…,min(K,p) 相互的点积都是0。而 vm 对 m=1,…,min(K,p) 同样。因而对于不同的 i,j , uTiYTYuj=0 且 vTiXTXvj=0 ,即 Yui 和 Yuj 不相关(uncorrelated),而 Xvi 与 Xvj 同样。
因此, um 与 vm m=1,…,min(K,p) 都可以用同样的奇异值分解方法得到。