支持向量机（SVM）后篇核函数（Kernels）线性不可分情况 SMO算法——机器学习

最新推荐文章于 2022-05-03 19:06:12 发布

Norstc

最新推荐文章于 2022-05-03 19:06:12 发布

阅读量1.7k

点赞数

分类专栏：人工智能与深度学习

本文链接：https://blog.csdn.net/a493823882/article/details/82024252

版权

人工智能与深度学习专栏收录该内容

68 篇文章 32 订阅

订阅专栏

六核函数（Kernels）

例如，对于二分问题，某些数据的结果需从一维映射到高维，才能线性可分，简而言之就是可以用超平面划分。比如，在线性回归单一特征的例子中，我们将唯一的特征x，映射到三维，分别为x,x^2,x^3。定义一个关于特征向量x的函数列向量φ(x)，这被称为特征映射，其中每一行代表映射的结果，比如上例的特征映射函数为

在SVM前篇的末尾中给出了超平面划分函数的表达式，其中含有训练数据与输入数据的内积一项，那么原内积变为。为了形式化定义核函数，若原始特征内积为，那么映射后的内积为，那么映射后的内积被称为核函数（Kernel），具体形式如下

那么映射后的划分函数中的内积就可替换为。

例如，若核函数为，那么展开后的具体形式为

据此得出，特征映射函数φ的表达式为下

那么为了计算变换过的内积，若根据上面的展开式计算，可知，复杂度为O(n^2)。但若通过(x^Tz)^2，可知复杂度为O(n)。所以若根据核函数的形式然后求出特征映射函数，可降低复杂度。

再如，若有如下核函数

可得φx为

更一般地，核函数将原特征映射到维的特征空间。

接着有如下核函数

若x与z值很接近，那么K值接近1；若x与z相差很远，那么K值接近0。由于此形式与高斯分布很相似，故此称为高斯核函数，也叫径向基函数(Radial Basis Function RBF)。RBF可讲特征映射到无限维，根据泰勒展式可有

可知，特征被映射到了无限维。更多解释可以到知乎搜索。

七核函数有效性判定

下面的问题是如何判定核函数是否可用，对于给定的K能否找到对应的φ。

对于核函数K，易得有

可知其为一个对称阵，那么对于核函数矩阵K，根据矩阵半正定的定义，有如下式子

可知K是半正定矩阵，可知K为有效的核函数，那么K为半正定矩阵。而这个结论反过来也是正确的，这样就有了Mercer定理，简单用一句话说就是：

Mercer定理：任何半正定的函数都可以作为函数

Mercer定理的完整证明，这里不赘述，可查阅相关资料。

八规则化和不可分情况处理(Regularization and the non-separable case)

看如下图

右图中加入的点（可称为噪声）会使超平面移动，会使总体判定水平下降，因此采用软间隔，改变问题为如下

松弛变量εi是针对那些影响判定的明显噪声点，如上图，该点据原超平面的距离为负，因此加入松弛变量后，原函数距离的限制从1变为了1-εi，表示允许部分距离小于1（包括负）。而放松限制条件后，我们需要重新调整目标函数，以对离群点进行处罚，目标函数后面加上CΣεi就表示离群点越多，离群越远对目标函数影响越大，C表示离群点的权重。

模型修改后，拉格朗日公式如下修改：