核方法(kernel Method)

核方法是一种将非线性数据映射到高维空间,使其变得线性可分的技术。通过核函数,可以避免直接计算高维空间的映射,简化计算复杂度,同时保持良好的泛化性能。常用的核函数有特定的性质,如正定性,且与原始空间的特征映射一一对应。这种方法常用于支持向量机(SVM)等算法中,用于分类和回归问题。
摘要由CSDN通过智能技术生成

核方法

核方法定义

一种能够将在原始数据空间中的非线性数据映射到高维线性可分的方法。

核方法的用处

1、低维数据非线性,当其映射到高维空间(feature space)时,可以用线性方法对数据进行处理。
2、线性学习器相对于非线性学习器有更好的过拟合控制从而可以更好地保证泛化性能,同时,利用核函数将非线性映射隐含在线性学习器中进行同步计算,使得计算复杂度与高维特征空间的维数无关。

在这里插入图片描述
如上,是将二维空间的非线性数据通过 ϕ \phi ϕ,把数据映射到了三维空间中。
并且我们发现,在高维空间中两个数据的内积,是原空间中对应数据的函数
(如上的 < ϕ ( x 1 , x 2 ) > , < ϕ ( x 1 ′ , x 2 ′ ) > = ( < x , x ′ > ) 2 <\phi(x_1,x_2)>,<\phi(x_1',x_2')>=(<x,x'>)^{2} <ϕ(x1,x2)>,<ϕ(x1,x2)>=(<x,x>)2),该函数被定义为 K ( x , x ′ ) K(x,x') K(x,x),称为核函数(将原始空间中的向量作为输入向量,并返回特征空间(转换后的数据空间,可能是高维)中向量的点积的函数称为核函数)。
注意:将数据映射到不同的高维空间,其对应的核函数不同。

核函数作用

1、通过 K ( x , x ′ ) K(x,x') K(x,x)我们可以直接计算出在feature space(高维空间)中点的两点间的距离平方和两个向量间的角度。
在这里插入图片描述
2、由于可以通过1中的方法计算出高维空间的距离和角度,我们完全可以不去计算出 ϕ \phi ϕ(一般 ϕ \phi ϕ难计算),可由 K ( x , x ′ ) K(x,x') K(x,x)直接处理高维空间的数据。
3、避免在高维空间运作,选择一个特征空间,其中点积可以使用输入空间中的非线性函数直接求值,降低了计算的复杂度(在高维空间中考虑的维数过多,计算也相当复杂)。

核矩阵

在这里插入图片描述

核函数要满足的条件

有限正半定(给定任意有限 n个点(x1~xn),求解其矩阵是正定的)
在这里插入图片描述

常用核函数在这里插入图片描述

K ( x , x i ) K(x,x_i) K(x,xi) ϕ \phi ϕ的关系

●只要知道kernel function,φ就不是必须的
●只要知道kernel function就可以达到计算需求
●有限半正定的kernel matrix可以使用
●k和φ是一一对应的
●知道kernel function 可以构建feature space

简单例子

y i y_i yi是标签,只有两个类别+1和-1,然后利用φ将x映射到更高维空间φ ( x ),下面就是投影之后的空间。同时计算出不同类别数据的两个中心点

在这里插入图片描述
然后计算出中垂线,通过新数据向量 ϕ ( x ) \phi(x) ϕ(x)与向量w的所成角来判断新数据的类别
在这里插入图片描述

在这里插入图片描述
由上面知,可以通过sign函数来判断新数据类别
在这里插入图片描述
以下是 < ϕ ( x ) − c , w > <\phi(x)-c,w> <ϕ(x)c,w>的计算方法,同样是可以用核函数来表示
在这里插入图片描述

Dual Representation

我们还可以用线性表达式来表示上面的式子
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值