核化线性降维(KPCA)的理解

1、为什么要提出核化线性降维(KPCA)?

答:PCA只能解决数据分布是线性的情况(数据大致分布在一个超平面附近),对于数据分布情况是非线性的有心无力
在这里插入图片描述
可以看到,假如数据分布是图(a)的样子,利用PCA得到的图(c)就是杂乱无章的,与他本真的结构差别比较大。
为了解决这个问题,提出了KPCA

2、KPCA的思想是什么?

答:你不是说数据分布不再是线性的了吗,那我就想到了,当初支持向量机也是遇到过这个问题,他是怎么解决的呢?他把数据映射到高维空间去,在高维空间这些数据就是线性的了。好的,那我也有想法,PCA 不是只能处理线性分布的数据吗,那我把这个非线性的数据映射到高维去不就变成线性分布的了吗。我再用 PCA 来处理映射后的高维数据,

好的,到这儿 KPCA 的思想就全部浮现了,把原始的非线性的数据映射到高维空间变成线性的,然后用 PCA 来处理映射后的高维数据。

在 PCA 里面有 x x T w = λ w ⇒ ( ∑ i = 1 m x i x i T ) w = λ w \mathbf{x}{{\mathbf{x}}^{\text{T}}}\mathbf{w}=\lambda \mathbf{w}\Rightarrow \left( \sum\limits_{i=1}^{m}{{{x}_{i}}}x_{i}^{\text{T}} \right)\mathbf{w}=\lambda \mathbf{w} xxTw=λw(i=1mxixiT)w=λw,然后选前d(这个由你自己指定)个大的特征值对应的特征向量组成变换矩阵。

那么在KPCA里面有 Z Z T W = λ W ⇒ ( ∑ i = 1 m z i z i T ) W = λ W Z{{Z}^{\text{T}}}\mathbf{W}=\lambda \mathbf{W}\Rightarrow \left( \sum\limits_{i=1}^{m}{{{z}_{i}}}z_{i}^{\text{T}} \right)\mathbf{W}=\lambda \mathbf{W} ZZTW=λW(i=1mziziT)W=λW ,Z是样本x映射到高维空间的像, z = ϕ ( x ) z=\phi (x) z=ϕ(x)
Z Z T W = ϕ ( X ) ϕ ( X ) T W Z{{Z}^{\text{T}}}\mathbf{W}=\phi (X)\phi {{(X)}^ {\text{T}}}\mathbf{W} ZZTW=ϕ(X)ϕ(X)TW,然后我们都知道映射函数不好求嘛,那么我们引入了核函数 K = ϕ ( X ) ϕ ( X ) T K=\phi (X)\phi {{(X)}^{\text{T}}} K=ϕ(X)ϕ(X)T,则可以推出 ⇒ K W = λ W \Rightarrow K\mathbf{W}=\lambda \mathbf{W} KW=λW,那么我们取K最大的d个的特征值对应的特征向量组成变换矩阵,不就可以了

  • 23
    点赞
  • 60
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 10
    评论
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

中南自动化学院至渝

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值