二:PCA 和 KPCA理解

前言

本文中的数据样本都是去中心化的,即可以理解为均值为0。

PCA

本例中是从二维降到一维

PCA的作用与要求

PCA是用于降维的一种方法,在降维后尽可能的保留样本最大的特征,即保证降维后方差最大化。
如下图例子所示所有样本,映射在蓝色的直线上(从二维降到一维),分布最广(用数学语言,就是映射在直线上的样本方差最大化)。
在这里插入图片描述

PCA中方差的表达

既然要求降维后方差要最大,首先我们得表示出降维后的方差表达,然后用最优化手段,将其最大化,即找出最优解。

第一步 映射后的样本坐标

图2
上图中将第一幅图的其中一个样本,和那条降维后的线单独拿出来,进行剖析。
我们需要表达出样本xj在降维后的坐标,通过高中向量知识可以很容易得出红色向量的长度为||xj||*cosθ,方向为v/||v||。假设v是一个单位向量,式子可以化简为<xj,v>v,前面的内积用线性代数表示就是<xj,v> = (xj)的转置乘上v,后面的v因为是单位正向量所以只是用于区分方向。
到这一步,我们可以表达出降维后的坐标了: vT(xj)(这是一个标量)
需要注意的是化简到这一步有一个条件那就是||v||=1。
得出下图:在这里插入图片描述

第二步 得出方差表达式

既然有了坐标,我们就可以表达出样本方差并化简成:
在这里插入图片描述

最优化问题:求方差最大值时的v

得到了方差后,就需要求出 在条件 ||v|| = 1 下 (此条件等价于 vT * v = 1),方差最大。所以引入拉格朗日乘子法:
在这里插入图片描述
变成解这个式子:
在这里插入图片描述
好巧不巧的是 :因为我们是要求(vT)Cv的max 由上式可知 Cv = λv,所以就是求(vT)λv = (vT)vλ的最大值,更巧的是 (vT)v TM的 等于 1,所以上面就成了求(vT)vλ=λ的最大值。

其中C是样本的协方差矩阵,所以总结一下,PCA问题就转变为求C的最大特征值和其特征向量(单位化),最终对应降维的坐标则是:vT(xj)

在这里插入图片描述

PCA例子

以防不懂举个例子,比如我每个样本特征是二维的,一共三个样本:
X1=[1,2]T, X2=[3,4]T, X3=[5,6]T
C经过计算应该是[35 44 ,44 56] /2 肯定是2*2矩阵,降到一维 就取最大特针值对应的特征向量,在单位化。
在这里插入图片描述

如果说三维降到二维就取前两项大的大特针值对应的特征向量。[(v1)T [(v2)T] * xj 第一个是23 矩阵 第二个是31
算出来的就是二维了。

KPCA

KPCA,就是核方法处理后,在此基础上进行PCA降维。

处理核化后的C矩阵

上文提到PCA问题已经转为C的特征值特征向量(单位化)求取,然后再求降维后的坐标。而此时的C已经成为在核化后空间上的协方差矩阵:由 x -> Φ(x)。
因为核技巧中Φ是不用知道的,即它是未知的,导致了此时的C也未知。要解决这个问题,只能将有关Φ的部分用核函数KF代替,才能求解C的特征值,特征向量。
在这里插入图片描述
那么如何求取呢?在前面一篇文章中我们有过核矩阵K的推导即:
在这里插入图片描述
因为核函数是知道的所以K也是已知的,那么如何用K来求取C的特征值,特征向量呢?
在这里插入图片描述
因为 K已知 所以说K的特征值和特征向量也是可以求的(上图所示),我们将特征方程两边都左乘X的转置,就可以发现原来K的特征值λ就是C的特征值,K特征向量u(单位化后)左乘X的转置就是C的特征向量。但是又出现一个问题X不知道,因为X是关于Φ(x)的矩阵。

求解(XT)u

我们是需要将C的特征向量单位化的,也就是说我们要求的是(XT)u /||(XT)u||:
在这里插入图片描述
化简后就是上图那个东西。(中间第二步到第三部解释一下,上图中XXT = K , ku = λu ,uTu = 1)
不过X依旧不知道,但是我们最终是要求出降维后的坐标,即vTΦ(x):
在这里插入图片描述
通过上图就可以将降维后的坐标求导出来。

方法总结

总的来说KPAC分为这么几步:
1.选取合适的KF,将原始训练样本映射到另一维度(目的:这个维度更容易用线性方法分类)-----也就是核技巧
2.知道KF, 知道训练样本,可以求出K矩阵,并求出他的特征向量(单位化),特征值。
3.通过K的特征值,特征向量求出C的特征向量表达式。
4.你想降到几维,就选C前几大的特征值对应的特征向量,将训练样本一起带入上图的式子,得出降维后的坐标。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值