支持向量机（SVM）详解（二）

最新推荐文章于 2024-07-08 17:32:03 发布

Leon1895

最新推荐文章于 2024-07-08 17:32:03 发布

阅读量676

点赞数 1

分类专栏：机器学习文章标签： SVM 支持向量机

本文链接：https://blog.csdn.net/qq_40793975/article/details/81739368

版权

本文深入探讨支持向量机的软间隔概念，解释了软间隔支持向量机的目标函数、对偶问题及KKT条件，并介绍了核函数的引入，包括常见的核函数类型及其性质。

摘要由CSDN通过智能技术生成

支持向量机（SVM）详解（二）

本文承接上一篇《支持向量机（SVM）详解（一）》，继续对支持向量机进行介绍，这篇文章分为两大部分：软间隔支持向量机和核函数的引入。

一、“软间隔”（Soft-margin）支持向量机

“软间隔”支持向量机是一种不满足式（2）的，不可以将训练样本“完美”划分的分类器。

目标函数

在现实任务中很多情况下都不满足式（2）这种情况，为了避免使用核函数带来的过拟合问题，软间隔支持向量机允许训练集中的一部分样本不满足“完美”划分条件，但是在最大化间隔时，应使不满足约束的样本点尽可能少。因此在式（4）的优化目标函数中加入损失函数 $lost\left(\mathbf{x}_i,y_i\right)$ ，来表示上述这些不满足约束的样本点的影响，即

当损失函数 $lost\left(\mathbf{x}_i,y_i\right)$ 采用0/1损失函数 $\begin{cases} 1, &z<0\\ 0, & \text{otherwise} \end{cases}$ 时（其中 $z=y_i\left(\omega^{T}\mathbf{x}_i+b\right)-1$ ），若参数 $C$ 无穷大，那么就会迫使所有样本点满足式（2）中的约束条件，而式（10）等价于式（4），反之，如果所有样本点均满足式（2）（此时损失函数不小于零），那么参数被迫为零，式（10）同样等价与式（4）；若参数为有限值，那么式（10）允许一部分样本点不满足式（2）。
但是，由于0/1损失函数不连续、数学性质不好，且由于其非凸而不满足凸优化条件使得强对偶性不成立【6】，因此不易于直接求解。于是出现了许多用来替代0/1损失函数的“替代损失”函数（Surrogate Loss Function），这些函数往往具有良好的数学性质，他们通常是凸的连续函数而且是0/1损失函数的上界，如下三种替代损失函数

这几种损失函数的关系由下图所示，其中红色线为0/1损失函数

由于损失函数不小于零的性质，在这里引入松弛变量（Slack Variable） $\xi_i\geqslant{0}$ ，优化目标函数中的损失函数 $lost\left(\mathbf{x}_i,y_i\right)$ 可以被替换为 $\xi_i\geqslant{0}$ ，这时，优化目标可以写为

这就是软间隔支持向量机的优化目标，其中松弛变量 $\xi_i\geqslant{0}$ 由来描述样本点不满足式（2）约束条件的程度，且满足【5】中二次规划问题的条件，可以采用现成的二次规划包来进行求解。
需要注意的是，式（11）中第一项可以看做是“结构风险”（Structural Risk），即模型过拟合的风险，另一项可以看做是“经验风险”（Empirical Risk），即模型与训练集的契合程度，参数是正则化系数，因此，式（11）可以称为“正则化问题”（Regularization Problem）。

目标函数的对偶问题

与硬间隔支持向量机中的讨论类似，在软间隔支持向量机中，优化目标的拉格朗日乘子函数可以表示为

其中

最低0.47元/天解锁文章

Leon1895

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
支持向量机（SVM）详解（二）

支持向量机（SVM）详解（二）本文承接上一篇《支持向量机（SVM）详解（一）》，继续对支持向量机进行介绍，这篇文章分为两大部分：软间隔支持向量机和核函数的引入。一、“软间隔”（Soft-margin）支持向量机　　“软间隔”支持向量机是一种不满足式（2）的，不可以将训练样本“完美”划分的分类器。目标函数　　在现实任务中很多情况下都不满足式（2）这种情况，为了避免使用核函...
复制链接

扫一扫

专栏目录