（二）SVM的核心问题

最新推荐文章于 2024-04-27 17:45:54 发布

Miracle_520

最新推荐文章于 2024-04-27 17:45:54 发布

阅读量929

点赞数

分类专栏：每日学习

本文链接：https://blog.csdn.net/Miracle_520/article/details/105325122

版权

每日学习专栏收录该内容

14 篇文章 1 订阅

订阅专栏

文章目录

一、SVM简介
二、SVM为什么采用间隔最大化（与感知机的区别）
三、SVM的目标（硬间隔）
四、求解目标（硬间隔）
五、软间隔
六、核函数
七、如何选择核函数
八、关于支持向量机的问题
九、为什么SVM对缺失数据敏感
十、SVM的优缺点

一、SVM简介

SVM是一种二分类模型。它的基本思想是在特征空间中寻找最大的分离超平面使得数据二分类。具体来讲，有三种情况（不加核函数的话就是个线性模型，加了核函数就是一个非线性模型）：

当训练样本线性可分时，通过硬间隔最大化，学习一个线性分类器，即线性可分支持向量机。
当训练数据近似线性可分时，引入松弛变量，通过软间隔最大化，学习一个线性分类器，即线性支持向量机。
当训练数据线性不可分时，通过使用核技巧及软间隔最大化，学习非线性支持向量机。

二、SVM为什么采用间隔最大化（与感知机的区别）

当训练数据线性可分时，存在无穷个分离超平面可以将两类数据正确分开。

感知机利用误分类最小策略，求得分离超平面，不过此时的解有无穷多个。
线性可分支持向量机利用间隔最大化求得最优分离超平面，这时，解是唯一的。另一方面，此时的分隔超平面所产生的分类结果是最鲁棒的，对未知实例的泛化能力最强。

三、SVM的目标（硬间隔）

有两个目标：

第一个是使间隔最大化
第二个是使样本正确分类

四、求解目标（硬间隔）

SVM是一个有约束条件的最优化问题，用拉格朗日函数来解决。
在满足Slater定理的时候，且过程满足KKT条件的时候，原问题转换成对偶问题
先求内部最小值，对w和b求偏导并令其等于0

五、软间隔

不管直接在原特征空间，还是在映射的高维空间，我们都假设样本是线性可分的。虽然理论上我们总能找到一个高维映射使数据线性可分，但在实际任务中，寻找一个合适的核函数很难。此外，由于数据通常由噪声存在，一味追求数据线性可分可能会使模型陷入过拟合，因此，我们放宽对样本的要求，允许少量样本分类错误。给之前的目标函数加上一个误差，将相当于允许原先的目标出错，引入松弛变量。松弛变量用hinge loss计算。