机器学习笔记之核函数

最新推荐文章于 2024-08-11 23:43:46 发布

HaiwiSong

最新推荐文章于 2024-08-11 23:43:46 发布

阅读量6.1k

点赞数 14

分类专栏：大数据：机器学习文章标签：核函数机器学习

本文链接：https://blog.csdn.net/oTengYue/article/details/80724478

版权

大数据：机器学习专栏收录该内容

20 篇文章 0 订阅

订阅专栏

基本概念
举例理解核函数
常用的核函数
核函数的选取原则

基本概念

核函数定义：
这里写图片描述
核函数：是映射关系的内积，映射函数本身仅仅是一种映射关系，并没有增加维度的特性，不过可以利用核函数的特性，构造可以增加维度的核函数，这通常是我们希望的。
例如这样一个图，数据集不是线性可分的：
这里写图片描述
该数据集在二维空间中，每个数据点都可用一个二维向量(x1,x2)’来表示（单引号’表示转置）。我们可以用一个椭圆形状的超平面在该2维空间中对数据集进行分类，我们写出椭圆的一般方程：

如果我们令：
这里写图片描述
你会发现，2维向量x被映射成另一个5维向量z后，分类超平面是一个线性超平面，数据点变得线性可分！也即是下面的变换：

也就是说，数据集在二维空间中线性不可分，若想实现线性可分，须把该数据集映射到一个5维空间中。
下图为效果图
这里写图片描述
结论：

在SVM的应用中，如果数据点在原空间中不是线性可分的，理想的做法是找到一个映射函数把数据映射到高维空间中，然后再进行分类。但是，映射后的目标空间往往是很高维甚至是无限维的，我们需要找到一个函数来代替求高维空间中向量内积的运算，我们命名它为核函数。一般的做法都是选择常用的核函数来使用，当然，你也可以自己构造核函数，前提是要满足Mercer条件。

举例理解核函数

用一个具体文本分类的例子来看看这种向高维空间映射从而分类的方法如何运作，想象一下，我们文本分类问题的原始空间是1000维的（即每个要被分类的文档被表示为一个1000维的向量），在这个维度上问题是线性不可分的。现在我们有一个2000维空间里的线性函数:
这里写图片描述
注意向量的右上角有个 ’ 哦。它能够将原问题变得可分。式中的 w’和x’都是2000维的向量，只不过w’是定值，而x’是变量（好吧,严格说来这个函数是2001维的,哈哈），现在我们的输入呢，是一个1000维的向量x，分类的过程是先把x变换为2000维的向量x’，然后求这个变换后的向量x’与向量w’的内积，再把这个内积的值和b相加，就得到了结果，看结果大于阈值还是小于阈值就得到了分类结果。

你发现了什么？我们其实只关心那个高维空间里内积的值，那个值算出来了，分类结果就算出来了。而从理论上说， x’是经由x变换来的，因此广义上可以把它叫做x的函数（有一个x，就确定了一个x’，对吧，确定不出第二个），而w’是常量，它是一个低维空间里的常量w经过变换得到的，所以给了一个w 和x的值，就有一个确定的f(x’)值与其对应。这让我们幻想，是否能有这样一种函数K(w,x),他接受低维空间的输入值，却能算出高维空间的内积值<w’,x’>？

如果有这样的函数，那么当给了一个低维空间的输入x以后，
这里写图片描述
这两个函数的计算结果就完全一样，我们也就用不着费力找那个映射关系，直接拿低维的输入往g(x)里面代就可以了（再次提醒，这回的g(x)就不是线性函数啦，因为你不能保证K(w,x)这个表达式里的x次数不高于1哦）。

万幸的是，这样的K(w,x)确实存在（发现凡是我们人类能解决的问题，大都是巧得不能再巧，特殊得不能再特殊的问题，总是恰好有些能投机取巧的地方才能解决，由此感到人类的渺小），它被称作核函数（核，kernel），而且还不止一个，事实上，只要是满足了Mercer条件的函数，都可以作为核函数。