主成分分析PCA

部分内容转至知乎,具体细节待整理。

线性降维

给定d维的原始数据 XRd×n X ∈ R d × n ,选择一个 r<d r < d ,通过优化 fX() f X ( · ) 可以得到一个投影矩阵 PRr×d P ∈ R r × d ,最终可以得到 Y=PXRr×n Y = P X ∈ R r × n 为降维后的数据。PCA要优化的目标函数:

fX(P)=||XPTPX||2F f X ( P ) = | | X − P T P X | | F 2

为什么有正交约束 PPT=I P P T = I

P P 为投影矩阵,P的每一列表示新的低维空间的基(坐标轴),P具有正交约束是要低维空间的这些基之间相互正交,且是单位向量。

总的优化目标

min||PXBS||2F+λ1||S||1+λ2||XPTPX||2F+λ3Tr(BUBT)+λ4SVM_Itemss.t. PPT=I,i||Bj||<c min | | P X − B S | | F 2 + λ 1 | | S | | 1 + λ 2 | | X − P T P X | | F 2 + λ 3 T r ( B U B T ) + λ 4 S V M _ I t e m s s . t .   P P T = I , ∑ i | | B j | | < c

当固定其他,更新P时,目标转化为

min s.t. ||PXBS||2F+λ2||XPTPX||2FPPT=I(71)(72) (71) min   | | P X − B S | | F 2 + λ 2 | | X − P T P X | | F 2 (72) s . t .   P P T = I

考虑对偶形式,

L(P,λ)=Tr{(PXBS)T(PXBS))}+λ2Tr{(XPTPX)T(XPTPX)}+λ(PPTI)(73)(74)(75) (73) L ( P , λ ) = T r { ( P X − B S ) T ( P X − B S ) ) } ① + (74) λ 2 T r { ( X − P T P X ) T ( X − P T P X ) } ② + (75) λ ( P P T − I ) ③

其中, λ2 λ 2 为超参数, λ λ 为拉格朗日乘子。先求 P P λ之间的关系,对P求一阶导,

P P 求导

第①部分求导如下,

(6)PL()=PTr{(PXBS)T(PXBS)}(7)=PTr{(XTPTSTBT)(PXBS))}(8)=PTr{XTPTPXSTBTPXXTPTBS+STBTBS}(9)=PTr{PTPXXTPXSTBTPXSTBT+STBTBS}(10)=2PXXT2(XSTBT)T(11)=2PXXT2BSXT

第②部分求导如下,
PL()=λ2PTr{(XPTPX)T(XPTPX)}=λ2PTr{(XTXTPTP)(XPTPX)}=λ2PTr{XTXXTPTPXXTPTPX+XTPTPPTPX}=λ2PTr{XTXXTPTPXXTPTPX+XTPTPX}=λ2PTr{XTXXTPTPX}=2λ2PXXT(12)(13)(14)(15)(16)(17) (12) ∇ P L ( ② ) = λ 2 ∇ P T r { ( X − P T P X ) T ( X − P T P X ) } (13) = λ 2 ∇ P T r { ( X T − X T P T P ) ( X − P T P X ) } (14) = λ 2 ∇ P T r { X T X − X T P T P X − X T P T P X + X T P T P P T P X } (15) = λ 2 ∇ P T r { X T X − X T P T P X − X T P T P X + X T P T P X } (16) = λ 2 ∇ P T r { X T X − X T P T P X } (17) = 2 λ 2 P X X T

第③部分求导如下,
PL()=λP(PPTI)=2λP(18)(19) (18) ∇ P L ( ③ ) = λ ∇ P ( P P T − I ) (19) = 2 λ P

令上述偏导=0,也即是,
PL=2PXXT2BSXT+2λ2PXXT+2λP=0 ∇ P L = 2 P X X T − 2 B S X T + 2 λ 2 P X X T + 2 λ P = 0

故,
(1+λ2)PXXT+λP=BSXTP((1+λ2)XXT+λI)=BSXT ( 1 + λ 2 ) P X X T + λ P = B S X T P ( ( 1 + λ 2 ) X X T + λ I ) = B S X T

两边同时转置,可得关系,
PT=((1+λ2)XXT+λI)1XSTBT P T = ( ( 1 + λ 2 ) X X T + λ I ) − 1 X S T B T

λ λ 求导

XXXX

参考

https://www.zhihu.com/question/41120789/answer/173530798
https://zhuanlan.zhihu.com/p/21580949
Linear Dimensionality Reduction: Survey, Insights, and Generalizations

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值