KPCA推导及理解

最新推荐文章于 2024-06-05 15:27:40 发布

ZLBryant

最新推荐文章于 2024-06-05 15:27:40 发布

阅读量5.3k

点赞数 12

分类专栏：机器学习文章标签： KPCA

本文链接：https://blog.csdn.net/qq_40824311/article/details/102607966

版权

最近上课学到了KPCA，之前也有遇到过，但并没有进行详细了解，这次上课老师讲的比较快，感觉糊里糊涂的，课后在网上找了一些资料进行学习，发现https://zhuanlan.zhihu.com/p/59775730这篇文章中讲的很详细，看完后自己也做了一下记录。思路KPCA和PCA一样也是进行降维，但区别在于KPCA处理的问题是非线性的。KPCA先将数据通过映射ϕ\phiϕ映射到高维空间，然后再...

摘要由CSDN通过智能技术生成

最近上课学到了KPCA，之前也有遇到过，但并没有进行详细了解，上课时老师讲的比较快，感觉糊里糊涂的，课后在网上找了一些资料进行学习，然后结合自己的理解进行了整理。

思路

KPCA和PCA一样也是进行降维，但区别在于KPCA处理的问题是非线性的。KPCA先将数据通过映射 $\phi$ 映射到高维空间，然后再将映射后的数据进行线性变换实现降维。
这个思路写得比较简略，大家可以先看后面的总结，有一个整体的印象，然后再进行阅读。

向高维空间映射

回顾PCA，我们知道PCA求解的最终问题是 $XX^{T}W=\lambda W$ （可以结合西瓜书相关章节进行复习）。
其中X为数据矩阵，每一列代表一个样本；W为降维时的线性变换矩阵，每个列向量w就是降维后的空间中的一个基向量（可以理解为直角坐标系下的坐标轴），基的个数决定了降维后数据的维数； $\lambda$ 为对角矩阵，对角线上的元素是 $XX^{T}$ 的特征值。
我们在此基础上引入非线性映射 $\phi$ ，那么上面问题就可以转换为 $\phi (X)[\phi (X)]^{T}W=\lambda W$ 。
其中W=( $w_{1},w_{2},...,w_{m}$ )，我们任取其中一个基向量w，可得 $\phi (X)[\phi (X)]^{T}w=\lambda w$ （1）。
注意我们通常并不直接定义 $\phi$ （这在核技巧中会有提及），也就是说我们并不知道 $\phi (X)[\phi (X)]^{T}$ 的具体内容，因此不能向PCA那样直接对其进行特征值分解。

因为 $\phi (X)[\phi (X)]^{T}=\sum_{i=1}^{N}\phi (x_{i})[\phi (x_{i})]^{T}$ ，那么（1）可以进一步表示为
$\sum_{i=1}^{N}\phi (x_{i})[\phi (x_{i})]^{T}w=\lambda w$

最低0.47元/天解锁文章

ZLBryant

关注

12
点赞
踩
76

收藏

觉得还不错? 一键收藏
4
评论
KPCA推导及理解

最近上课学到了KPCA，之前也有遇到过，但并没有进行详细了解，这次上课老师讲的比较快，感觉糊里糊涂的，课后在网上找了一些资料进行学习，发现https://zhuanlan.zhihu.com/p/59775730这篇文章中讲的很详细，看完后自己也做了一下记录。思路KPCA和PCA一样也是进行降维，但区别在于KPCA处理的问题是非线性的。KPCA先将数据通过映射ϕ\phiϕ映射到高维空间，然后再...
复制链接

扫一扫