机器学习之PCA降维理论推导

1. PCA降维后的超平面大概具有这样的性质

(1)最近重构性:样本点到这个超平面的距离的足够近

(2)最大可分性:样本点在这个超平面的投影尽可能分开

2. 依据最近重构性推导:

    假定数据样本进行了中心化,再假设投影变换后得到的新坐标系为W  ={W1,W2,...,Wd},其中Wi是标准正交基向量, ||Wi||2 = 1, Wi.T*Wj = 0(i != j)。

若丢弃新坐标系中的部分坐标,即将维度降到d'<d。则样本点Xi在低维坐标系中的投影是Zi = (Zi1,Zi2,...,Zid'),其中Zij = Wj.T*Xi 是Xi在低维坐标系下第j维

的坐标。若基于Zi来重构Xi,则会得到Xi_hat = W*Zi。

    设样本X.shape = (n,m),空间向量W.shape = (n,d'),则Z = W.T*X, Z.shape = (d',m)。若基于Z来重构X,则X_hat = W*Z,X_hat.shape = (n,m)。


    

其中λ是XXT的特征值,W是特征向量组成的矩阵。

3. 从最大可分性出发

    

    

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值