(一)三维点云课程---Kernel PCA介绍

最新推荐文章于 2024-06-28 17:40:49 发布

月夕花晨TS

最新推荐文章于 2024-06-28 17:40:49 发布

阅读量431

点赞数

文章标签：人工智能

本文链接：https://blog.csdn.net/qq_45369294/article/details/120907533

版权

KernelPCA是一种非线性降维技术，通过核函数将数据映射到高维空间再进行PCA。推导过程中，首先假设非线性映射后的数据是零中心的，然后计算核矩阵并进行特征值分解。通过选择合适的核函数（如线性、多项式、高斯或拉普拉斯核），可以处理非线性数据。在实际应用中，需要对核矩阵进行单位化处理，并求解特征向量，最后将新数据投影到降维空间。

摘要由CSDN通过智能技术生成

Kernel PCA介绍

三维点云课程---Kernel PCA介绍

Kernel PCA介绍

经过上面PCA的介绍，发现PCA是个好东西，但是仔细分析发现PCA是线性，对于下面的情况，PCA就没有办法：
在这里插入图片描述

此时需要将数据先通过核函数转换到一个新的空间，也就是升维过程，然后再利用PCA进行降维处理。

1.推导过程

1.输入数据 $x_i \in R^{n_0}$ ,存在一个非线性函数映射 $\phi :{R^{{n_0}}} \to {R^{{n_1}}}$ ,其实就是升维过程
2.按照线性PCA的过程，对 $R^{n_1}$ 进行PCA操作

2.1假设 $\phi(x_i)$ 总是零中心
$\frac{1}{N}\sum\limits_{i = 1}^N {\phi ({x_i}) = 0}$
2.2计算协方差矩阵

$\widetilde H = \frac{1}{N}\sum\limits_{i = 1}^N {\phi ({x_i})} {\phi ^T}({x_i})$

2.3计算协方差矩阵的特征值和特征向量
$\widetilde H \widetilde z = \widetilde \lambda \widetilde z$
上述过程看似很简单,但是还是有一些问题,第一个就是怎么确定上述的非线性函数 $\phi$ ;第二个怎么避免高维数据的运算。

通过2.2和2.3可以推出
$\widetilde H \widetilde z = \frac{1}{N}\sum\limits_{i = 1}^N {\phi ({x_i})} {\phi ^T}({x_i})\widetilde z = \widetilde \lambda \widetilde z$

因为 $\frac{{{\phi ^T}({x_i})\widetilde z}}{{\widetilde \lambda N}}$ 是常数，故
$\widetilde z = \sum\limits_{i = 1}^N {\phi ({x_i})} \frac{{{\phi ^T}({x_i})\widetilde z}}{{\widetilde \lambda N}} = \sum\limits_{j = 1}^N {{\alpha _j}\phi ({x_j})}$

发现求解特征向量 $\widetilde z$ 可以转化为求解一系列系数 $\alpha_j$ 和一个非线性函数 $\phi(x)$

1.1求解 $\alpha_j$

再次利用 $\widetilde H \widetilde z = \widetilde \lambda \widetilde z$ ，以及上式 $\widetilde z$ 的信息，可以得出
$\frac{1}{N}\sum\limits_{i = 1}^N {\phi ({x_i}){\phi ^T}({x_i})} (\sum\limits_{j = 1}^N {{\alpha _j}\phi ({x_j})} ) = \overline \lambda \sum\limits_{j = 1}^N {{\alpha _j}\phi ({x_j})}\\ \frac{1}{N}\sum\limits_{i = 1}^N {\phi ({x_i})} (\sum\limits_{j = 1}^N {{\alpha _j}{\phi ^T}({x_i})\phi ({x_j})} ) = \overline \lambda \sum\limits_{j = 1}^N {{\alpha _j}\phi ({x_j})}$
定义核函数 $k(x_i,x_j)=\phi^T(x_i) \phi(x_j)$ ,那么上式化简为
$\frac{1}{N}\sum\limits_{i = 1}^N {\phi ({x_i})} (\sum\limits_{j = 1}^N {{\alpha _j}k({x_i},{x_j})} ) = \overline \lambda \sum\limits_{j = 1}^N {{\alpha _j}\phi ({x_j})}$
两边同时乘以 $\phi^T(x_k)$ ,k=1,2…,N,化简得
$\frac{1}{N}\sum\limits_{i = 1}^N {{\phi ^T}({x_k})\phi ({x_i})} (\sum\limits_{j = 1}^N {{\alpha _j}k({x_i},{x_j})} ) = \overline \lambda \sum\limits_{j = 1}^N {{\alpha _j}{\phi ^T}({x_k})\phi ({x_j})} \\ \frac{1}{N}\sum\limits_{i = 1}^N {k({x_k},{x_i})} \sum\limits_{j = 1}^N {{\alpha _j}k({x_i},{x_j})} ) = \overline \lambda \sum\limits_{j = 1}^N {{\alpha _j}k({x_k},{x_j})},k=1,....,N$
进而得代数形式
$\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _j}k({x_k},{x_i})k({x_i},{x_j})} ) = N\overline \lambda \sum\limits_{j = 1}^N {{\alpha _j}k({x_k},{x_j})} } , k=1,....,N$
现在定义核矩阵 $K\in R^{n \times n},K(i,j)=k(x_i,x_j)$ ,K是对称矩阵

通过将代数形式变为矩阵形式,思考一下怎么变形的？其实也要用到k=1,2,…,N这个信息，将每种k情况进行展开，然后在合并。
$K^2\alpha=N\widetilde \lambda K \alpha$
化简得
$\alpha=N\widetilde \lambda \alpha \\ 令N\widetilde \lambda=\lambda \\ K \alpha= \lambda \alpha$
对上式进行特征值分解，可以得到特征向量 $\alpha_\gamma$ 和特征值 $\lambda_\gamma,\gamma=1,...,l$

但是 $\widetilde z$ 是个单位向量，而如果令 $\alpha_j=\alpha_\gamma$ ,就不能保证这个性质了。于是归一化单位向量 $\widetilde z$
$1=\widetilde z^T_{\gamma} \widetilde z_{\gamma} \\ 1 = \sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _{\gamma_i}}{\alpha _{\gamma_j}}{\phi ^T}({x_i})\phi ({x_j})} } = \sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _{\gamma_i}}{\alpha _{\gamma_j}}k({x_i},{k_j})} }$
写成矩阵形式,z证明见附录
$\alpha ^T_{\gamma }K{\alpha _\gamma }$
因为 $\alpha= \lambda \alpha$ ,所以上式
$\alpha_\gamma^T \alpha_\gamma=\frac{1}{{{\lambda _\gamma }}}$

于是我们只要对求出的 $\alpha_\gamma$ 类似归一化就是 $\alpha_j$ ,那么怎么进行类似归一化呢，详见附录

1.2 求解非线性函数 $\phi(x)$

因为非线性函数 $\phi(x)$ 不能直接求出,那么特征向量 $\widetilde z$ 就不能直接求出。但是我们并不需要特征向量的直接信息，因为我们最终会将数据重新投影到特征向量 $\widetilde z$ 上，那么
${y_r} = {\phi ^T}(x){\widetilde z_\gamma } = \sum\limits_{j = 1}^N {{\alpha _{\gamma j}}{\phi ^T}(x)\phi ({x_j})} = \sum\limits_{j = 1}^N {{\alpha _{\gamma j}}k(x,{x_j})}$
根据上式可以知道，我们只需要知道$\alpha $和核函数 k 即可求出投影后的$ {y_r}$

说了这么多核函数，核函数有以下几个形式

线性核函数: $k(x_i,x_j)=x^T_{i}x_j$
多项式核函数: $k(x_i,x_j)=(1+x^T_{i}x_j)^p$
高斯核函数: $k(x_i,x_j)=e^{-\beta||x_i-x_j||_2}$
拉普拉斯核函数: $k(x_i,x_j)=e^{-\beta||x_i-x_j||_1}$

关于核函数的选择，没有明确的方法，需要在实验中不停的尝试。

1.3注意点

在推导Kernel PCA自前，我们假设了 $\phi(x_i)$ 总是零中心，而实际的 $\phi(x_i)$ 并不是零中心，那么
$\widetilde \phi ({x_i}) = \phi ({x_i}) - \frac{1}{N}\sum\limits_{j = 1}^N {\phi ({x_j})}$
那么单位化的核 $\widetilde k(x_i,x_j)$
$\widetilde k(x_i,x_j)=\widetilde \phi^T_{x_i} \widetilde \phi(x_j)\\ ={(\phi ({x_i}) - \frac{1}{N}\sum\limits_{k = 1}^N {\phi ({x_k})} )^T}(\phi ({x_j}) - \frac{1}{N}\sum\limits_{l = 1}^N {\phi ({x_l})} )\\ =k({x_i},{x_j}) - \frac{1}{N}\sum\limits_{k = 1}^N {k({x_i},{x_k}) - \frac{1}{N}\sum\limits_{k = 1}^N {k({x_j},{x_k}) + \frac{1}{{{N^2}}}\sum\limits_{k = 1}^N {\sum\limits_{l = 1}^N {k({x_k},{x_l})} } } }$
转换成矩阵形式，具体证明参见附录
$\widetilde K = K - 2{T_{\frac{1}{N}}}K + {T_{\frac{1}{N}}}K{T_{\frac{1}{N}}},其中T_{\frac{1}{N}}为N \times N的矩阵，矩阵中每一个元素均为1$

2.Kernel PCA总结

选择一个核函数 $k(x_i,x_j)$ ,计算核矩阵 $K(i,j)=k(x_i,x_j)$
单位化K
$\widetilde K = K - 2{T_{\frac{1}{N}}}K + {T_{\frac{1}{N}}}K{T_{\frac{1}{N}}},其中T_{\frac{1}{N}}为N \times N的矩阵，矩阵中每一个元素均为1$
求解 $\widetilde K$ 特征值和特征向量

$\widetilde K \alpha_\gamma=\lambda_\gamma\alpha_\gamma$
单位化 $\alpha_\gamma^T\alpha_\gamma=\frac{1}{\lambda_\gamma}$
将任意的点 $\in R^n$ 计算其投影到 $r^{th}$ 的主成分 $y_r \in R$
${y_r} = {\phi ^T}(x){\widetilde z_\gamma } = \sum\limits_{j = 1}^N {{\alpha _{\gamma j}}{\phi ^T}(x)\phi ({x_j})} = \sum\limits_{j = 1}^N {{\alpha _{\gamma j}}k(x,{x_j})}$

附录

1.证明

$代数形式\Leftrightarrow \sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _{\gamma_i}}{\alpha _{\gamma_j}}k({x_i},{k_j})} }=\alpha ^T_{\gamma}K{\alpha _\gamma } \Leftrightarrow 矩阵形式$

证明如下

先展开求和公式
$\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _{{\gamma _i}}}{\alpha _{{\gamma _j}}}k({x_i},{k_j})} } = {\alpha _{\gamma 1}}({\alpha _{\gamma 1}}k({x_1},{k_1}) + {\alpha _{\gamma 2}}k({x_1},{k_2}) + ... + {\alpha _{\gamma N}}k({x_1},{k_N})) + {\alpha _{\gamma 2}}({\alpha _{\gamma 1}}k({x_1},{k_1}) + {\alpha _{\gamma 2}}k({x_1},{k_2}) + ... + {\alpha _{\gamma N}}k({x_1},{k_N})) + ... + {\alpha _{\gamma N}}({\alpha _{\gamma 1}}k({x_1},{k_1}) + {\alpha _{\gamma 2}}k({x_1},{k_2}) + ... + {\alpha _{\gamma N}}k({x_1},{k_N}))$
将后面的求和写成矩阵形式

$\begin{bmatrix}{{\alpha _{\gamma 1}}}&{{\alpha _{\gamma 2}}}&{...}&{{\alpha _{\gamma N}}}\end{bmatrix} \begin{bmatrix} {\begin{bmatrix} {{\alpha _{\gamma 1}}}&{{\alpha _{\gamma 2}}}&{...}&{{\alpha _{\gamma N}}} \end{bmatrix} \begin{bmatrix} {k({x_1},{x_1})}\\ {k({x_1},{x_2})}\\ {...}\\ {k({x_1}{x_N})} \end{bmatrix}}\\ {\begin{bmatrix} {{\alpha _{\gamma 1}}}&{{\alpha _{\gamma 2}}}&{...}&{{\alpha _{\gamma N}}} \end{bmatrix} \begin{bmatrix} {k({x_2},{x_1})}\\ {k({x_2},{x_2})}\\ {...}\\ {k({x_2}{x_N})} \end{bmatrix}}\\ {...}\\ {\begin{bmatrix} {{\alpha _{\gamma 1}}}&{{\alpha _{\gamma 2}}}&{...}&{{\alpha _{\gamma N}}} \end{bmatrix} \begin{bmatrix} {k({x_N},{x_1})}\\ {k({x_N},{x_2})}\\ {...}\\ {k({x_N}{x_N})} \end{bmatrix}} \end{bmatrix}\\ = \left[ {\begin{bmatrix} {{\alpha _{\gamma 1}}}&{{\alpha _{\gamma 2}}}&{...}&{{\alpha _{\gamma N}}} \end{bmatrix}} \right] \begin{bmatrix} {k({x_1},{x_1})}&{k({x_1},{x_2})}&{...}&{k({x_1},{x_N})}\\ {k({x_2},{x_1})}&{k({x_2},{x_2})}&{...}&{k({x_2},{x_N})}\\ {...}&{...}&{...}&{...}\\ {k({x_N},{x_1})}&{k({x_N},{x_2})}&{...}&{k({x_N},{x_N})} \end{bmatrix} \begin{bmatrix} {{\alpha _{\gamma 1}}}\\ {{\alpha _{\gamma 2}}}\\ {...}\\ {{\alpha _{\gamma N}}} \end{bmatrix}\\ =\alpha {\gamma ^T}K{\alpha _\gamma }$

2 类似归一化的推导

已知
$\alpha_\gamma^T \alpha_\gamma=\frac{1}{{{\lambda _\gamma }}}$
因为 $\alpha_\gamma=[x_1,x_2,...,x_N]^T$ ,它本身并没有归一化，即 $\alpha_\gamma^T \alpha_\gamma \ne \frac{1}{{{\lambda _\gamma }}}$ ,需要重新找到一个向量 $\beta_\gamma=[x'_1,x'_2,...,x'_N]$ 满足 $\beta_\gamma^T \beta_\gamma=\frac{1}{{{\lambda _\gamma }}}$ ,并且满足以下条件，那么
$\frac{{{{x'}_1}}}{{{x_1}}} = \frac{{{{x'}_2}}}{{{x_2}}} = ... = \frac{{{{x'}_N}}}{{{x_N}}} = k$
综上所述：
$\left\{ \begin{array}{l} \beta _\gamma ^T{\beta _\gamma } = {{x'}_1}^2 + {{x'}_2}^2 + ... + {{x'}_N}^2 = \frac{1}{{{\lambda _\gamma }}}\\ {{x'}_1} = k{x_1}\\ {{x'}_2} = k{x_2}\\ ...\\ {{x'}_N} = k{x_N} \end{array} \right.$
进行求解
$\left\{ \begin{array}{l} {{x'}_1} = \frac{{{x_1}}}{{\sqrt {\lambda_\gamma ({x_1}^2 + {x_2}^2 + ... + {x_N}^2)} }}\\ {{x'}_2} = \frac{{{x_2}}}{{\sqrt {\lambda_\gamma ({x_1}^2 + {x_2}^2 + ... + {x_N}^2)} }}\\ ...\\ {{x'}_N} = \frac{{{x_N}}}{{\sqrt {\lambda_\gamma ({x_1}^2 + {x_2}^2 + ... + {x_N}^2)} }} \end{array} \right.$
此时 $\beta_\gamma=[x'_1,x'_2,...,x'_N]$ 就是类似归一化的结果 $\alpha_\gamma$ 。

3.证明

$k({x_i},{x_j}) - \frac{1}{N}\sum\limits_{k = 1}^N {k({x_i},{x_k}) - \frac{1}{N}\sum\limits_{k = 1}^N {k({x_j},{x_k}) + \frac{1}{{{N^2}}}\sum\limits_{k = 1}^N {\sum\limits_{l = 1}^N {k({x_k},{x_l})} } } }= K - 2{T_{\frac{1}{N}}}K + {T_{\frac{1}{N}}}K{T_{\frac{1}{N}}}$

先引入一个性质
$\begin{bmatrix} {{k_{11}}}&{{k_{12}}}&{{k_{13}}}\\ {{k_{21}}}&{{k_{22}}}&{{k_{23}}}\\ {{k_{31}}}&{{k_{32}}}&{{k_{33}}} \end{bmatrix} \begin{bmatrix} 1&1&1\\ 1&1&1\\ 1&1&1 \end{bmatrix} = \begin{bmatrix} {{k_{11}} + {k_{12}} + {k_{13}}}&{{k_{11}} + {k_{12}} + {k_{13}}}&{{k_{11}} + {k_{12}} + {k_{13}}}\\ {{k_{21}} + {k_{22}} + {k_{23}}}&{{k_{21}} + {k_{22}} + {k_{23}}}&{{k_{21}} + {k_{22}} + {k_{23}}}\\ {{k_{31}} + {k_{32}} + {k_{33}}}&{{k_{31}} + {k_{32}} + {k_{33}}}&{{k_{31}} + {k_{32}} + {k_{33}}} \end{bmatrix}$
即当一个矩阵K和1矩阵进行右乘时 $K * 1$ ，得到的矩阵，每一行都是K矩阵对应那一行所有元素之和；同理可以得到，当进行左乘时 $1 * K$ ,得到的矩阵，每一列都是每一列都是K矩阵对应那一列所有元素之和；当进行 $1 * K * 1$ ,矩阵的每一个元素均是原先K矩阵所有元素之和。

通过以上性质，将左式的求和公式展开，即：
$\frac{1}{N}\sum\limits_{k = 1}^N {k({x_i},{x_k})} \to K*\frac{1}{N}矩阵\\ \frac{1}{N}\sum\limits_{k = 1}^N {k({x_j},{x_k})} \to \frac{1}{N}矩阵*K\\ \frac{1}{{{N^2}}}\sum\limits_{k = 1}^N {\sum\limits_{l = 1}^N {k({x_k},{x_l})} } \to \frac{1}{N}矩阵*K*\frac{1}{N}矩阵$
最后在合并即可，其中 $\frac{1}{N}$ 矩阵表示 $\times N$ ，所有元素均为1的矩阵。

月夕花晨TS

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
(一)三维点云课程---Kernel PCA介绍

Kernel PCA介绍经过上面PCA的介绍，发现PCA是个好东西，但是仔细分析发现PCA是线性，对于下面的情况，PCA就没有办法：此时需要将数据先通过核函数转换到一个新的空间，也就是升维过程，然后再利用PCA进行降维处理。1.推导过程1.输入数据xi∈Rn0x_i \in R^{n_0}xi∈Rn0 ,存在一个非线性函数映射ϕ:Rn0→Rn1\phi :{R^{{n_0}}} \to {R^{{n_1}}}ϕ:Rn0→Rn1,其实就是升维过程2.按照线性PCA的过程，对Rn1R^{n_
复制链接

扫一扫