支持向量回归预测怎么做_机器学习之2——支持向量机(SVM)与支持向量回归(SVR)...

最新推荐文章于 2024-08-19 14:45:48 发布

weixin_39820185

最新推荐文章于 2024-08-19 14:45:48 发布

阅读量4k

点赞数

文章标签：支持向量回归预测怎么做

给定训练样本集

，分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面，将不同类别的样本分开，但能将训练样本分开的划分超平面可能有很多，我们需要找到分类最“可靠”的一条。

直观上，应该找位于训练样本“正中间”的一条，如上图粗线所示，因为该划分超平面对训练样本局部扰动的“容忍”性最好，即划分超平面所产生的分类结果是最鲁棒的，对未见示例的泛化能力最强。

超平面划分标准

在样本空间中，划分超平面可通过的线性方程：

，其中

为超平面划分线的法向量，决定了超平面的方向，

为位移项，决定超平面与原点之间的距离，显然，划分超平面可被法向量

和位移

确定，将其即为

，样本空间任意点

到超平面

的距离为：

。

假设超平面

能将训练样本正确分类，即对于

，若

，则

；若

，则

。

这里将样本与划分线之间的最小间隔定为1。

这里为什么将间距定为1呢？因为便于计算，原始间隔为未知数

，如果存在某划分线

可以成功将训练样本正确分类，那么总会存在缩放变换

使得上式成立，即左右两边同时除以间隔距离

。

距离超平面最近的这几个训练样本点使得上式成立，它们被称为“支持向量”。两个异类支持向量到超平面的距离之和为：

，被称为“间隔”。

想找到具有“最大间隔”(maximum margin)的划分超平面，也就是要找到能满足上式中约束的参数

和

，使得

最大，即：

，

对偶问题

那么我们知道支持向量机的基本型之后，该如何求解得到最优的

呢？，上式其实是一种凸二次规划问题，可以利用拉格朗日乘子法得到其“对偶问题”，对上式每条约束添加拉格朗日乘子

，可以改写为：

，

令

对

和

的偏导为零可得到：

再将其带入拉格朗日乘子式中可以得到：

，

求解出

后，求出

与

即可得到模型：

从对偶的问题可以解出

是拉格朗日乘子，对应着训练样本

，注意到不等式约束，上述过程满足KKT条件：

对任意训练样本

，总有

或者

。若

,则该样本不会出现，不会对

有任何影响。若

,则必有

,所对应的样本点位于最大间隔边界上，是一个支持向量。

这展现了支持向量机一个重要的性质：大部分训练样本在训练完成后不需要保留，最终模型仅仅与支持向量有关。

SMO(Sequential Minimal Optimization)

基本思想：固定

之外的所有参数，然后求

上的极值，由于存在约束

，若固定

之外的其他变量，则

可由其他变量导出，于是，SMO每次选择两个变量

和

，并固定其他参数，这样参数初始化后，SMO不断执行如下两个步骤直到收敛：

选取一对需更新的变量
和

；
固定
和

以外的参数，求解并获得更新后的

和

。

注意到只需选取的

和

中有一个不满足KKT条件，目标韩数就会在迭代后增大。直观上看，KKT条件违背的程度越大，则变量更新后可能导致的目标函数值增幅越大，于是，SMO先选取违背KKT条件程度最大的变量，第二个变量应选择一个使目标函数值增长最快的变量。SMO的启发式：使选取的两变量所对应的样本之间的间隔最大。一种直观解释是，这样的两个变量有很大的差别，与对两个相似的变量进行更新对比，对它们进行更新后会带给目标函数值更大的变化。

SMO算法之所以高效，恰恰由于在固定其他参数后，仅优化两个参数的过程能做到非常高效，具体来说，仅考虑

和

时，上式的约束可重新写成：

，其中

是使

成立的常数，用

，消去变量

可得到关于

的单变量二次规划问题，仅有约束

，这次的二次规划问题具有闭式解。

注意到对于任意支持向量

都有