线性支持向量机

最新推荐文章于 2024-07-25 21:10:30 发布

qq_41802245

最新推荐文章于 2024-07-25 21:10:30 发布

阅读量153

点赞数

文章标签：机器学习支持向量机

本文链接：https://blog.csdn.net/qq_41802245/article/details/104480239

版权

线性支持向量机

实际当中大多数数据集都不是线性可分的，线性支持向量机主要是针对去掉少数样本之后线性可分样本数据集。线性不可分即意味着由少数样本点不能满足函数间隔大于等于1的约束条件，因此可以对每一个样本点加上一个松弛变量，并对每个松弛变量进行惩罚。于是原始问题变为：
$min_{\omega ,b ,\xi}~\frac{1}{2}||\omega||^2+C\sum_{i=1}^{N}\xi_{i}$
$s.t.~~y_{i}(\omega\cdot x_{i}+b)+\xi_{i}\ge1$
$\xi_{i}\ge0,i=1,...,N$

在这里插入图片描述

$\frac{\xi_{i}}{||\omega||}$ 为错分样本或分对的样本但到所对应的间隔超平面的函数间隔没有达到1的样本到所对应的超平面的距离，如上图所示。
原问题是一个凸二次规划问题， $(\omega,b,\xi)$ 的解存在， $\omega$ 是唯一的， $b$ 的解不唯一。

求解分离超平面

求解方法和线性可分支持向量机差不多：
写出原问题的对偶问题 $\gg$ 由对偶问题的解写出原问题的解

原问题的对偶问题

Step1:原问题的拉格朗日函数为
$L(\omega,b,\xi,\alpha,\mu)=\frac{1}{2}||\omega||^2+C\sum_{i=1}^N \xi_{i}-\sum_{i=1}^N\alpha_{i}(y_{i}(\omega\cdot x_{i}+b)-1+\xi_{i})-\sum_{i}^{N}\mu_{i}\xi_{i}$

原问题形如：
$min_{x\in R }f(x)$
$s.t~~c_{i}(x) \le0,h_{j}(x)=0$
$i = 1, . . ., m; j = 1, . . ., n$
其拉格朗日函数为：
$L(x^{*},\alpha^*,\beta^*)=f(x)+\sum_{i}\alpha_{i}c_{i}(x)+\sum_{j}\beta_{j}h_{j}(x)$

Step2:求 $min_{\omega,b,\xi}~~L(\omega,b,\xi,\alpha,\mu)$
$\bigtriangledown_{\omega}~L(\omega,b,\xi,\alpha,\mu)=\omega-\sum_{i}\alpha_{i}y_{i}x_{i}=0$
$\bigtriangledown_{b}~L(\omega,b,\xi,\alpha,\mu)=-\sum_{i}\alpha_{i}y_{i}=0$
$\bigtriangledown_{\xi}~L(\omega,b,\xi,\alpha,\mu)=C-\alpha_{i}-\mu_{i}=0$

将上面三个式子带入 $min_{\omega,b,\xi}~~L(\omega,b,\xi,\alpha,\mu)$ ，得：
$min_{\omega,b,\xi}~~L(\omega,b,\xi,\alpha,\mu)=-\frac{1}{2}\sum_{i=1}^{N}\sum_{i=1}^{N}\alpha_{i}\alpha_{j}y_{i}y_{j}(x_{i},x_{j})+\sum_{i=1}^{N}\alpha_{i}$
Step3:最后得到对偶问题
$max_{\alpha}~~-\frac{1}{2}\sum_{i=1}^{N}\sum_{i=1}^{N}\alpha_{i}\alpha_{j}y_{i}y_{j}(x_{i},x_{j})+\sum_{i=1}^{N}\alpha_{i}$
$s.t.~~\sum_{i=1}^{N}\alpha_{i}y_{i}=0$
$~~~~~~~~C=\alpha_{i}+\mu_{i}$
$\alpha_{i}\ge 0,\mu_{i}\ge0,i=1,...,N$
去掉 $\mu_{i}$ ，得到对偶问题

$min_{\alpha}~~\frac{1}{2}\sum_{i=1}^{N}\sum_{i=1}^{N}\alpha_{i}\alpha_{j}y_{i}y_{j}(x_{i},x_{j})-\sum_{i=1}^{N}\alpha_{i}$
$s.t.~~\sum_{i=1}^{N}\alpha_{i}y_{i}=0$
$~~~~~~~~0\le\alpha_{i}\le C$
$i = 1, . . ., N$

对偶问题求解

采用上一篇提出的SMO算法

由对偶问题的解写出原问题的解

原始问题是凸二次规划问题，故其拉格朗日函数满足KKT条件，即
$\bigtriangledown_{\omega}~L(\omega,b,\xi,\alpha,\mu)=\omega-\sum_{i}\alpha_{i}y_{i}x_{i}=0$
$\bigtriangledown_{b}~L(\omega,b,\xi,\alpha,\mu)=-\sum_{i}\alpha_{i}y_{i}=0$
$\bigtriangledown_{\xi}~L(\omega,b,\xi,\alpha,\mu)=C-\alpha_{i}-\mu_{i}=0$
$\alpha_{i}(y_{i}(\omega\cdot x_{i}+b)-1+\xi_{i})=0$
$\mu_{i}\xi_{i}=0$
$y_{i}(\omega\cdot x_{i}+b)-1+\xi_{i})\ge0$
$\xi_{i}\ge0,\alpha_{i}\ge0,\mu_{i}\ge0$
$i = 1, . . ., N$
因此得到原问题的解和对偶问题的解的关系：

$\omega=\sum_{i=1}^{N}\alpha_{i}y_{i}x_{i}$
$b=y_{j}-\sum_{i=1}^{N}\alpha_{i}y_{i}(x_{i}\cdot x_{j})$
其中 $0\le \alpha_{i}\le C$

最终求得超平面

$\sum_{i=1}^{N}\alpha_{i}y_{i}(x\cdot x_{i})+b=0$
决策函数
$f(x)=sign(\sum_{i=1}^{N}\alpha_{i}y_{i}(x\cdot x_{i})+b)$

支持向量

$\alpha_{i}>0$ 对应得样本点 $x_{i},y_{i})$ 为支持向量，此时由KKT条件可知，支持向量分如下几种情况

$\begin{cases} \alpha_{i}\le C, \mu_{i}>0,\xi_{i}=0,y_{i}( {\omega\cdot x_{i}+b)=1} &{\text{ 分类正确，支持向量落在边界上}}\\ \alpha_{i}=C, \mu_{i}=0,0<\xi_{i}<1,0,y_{i}( {\omega\cdot x_{i}+b)+\xi_{i}=1} &{\text{分类正确，支持向量落在边界和超平面之间}}\\ \alpha_{i}=C,\mu_{i}=0,\xi_{i}=1,y_{i}( \omega\cdot x_{i}+b)=0&{\text{分类未知，支持向量落在超平面上}}\\ \alpha= C,\mu_{i}=0,\xi_{i}>1,y_{i}( {\omega\cdot x_{i}+b)+\xi_{i}=1} &{\text{分类错误，支持向量位于超平面误分一次}} \end{cases}$
上一篇

qq_41802245

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
线性支持向量机

线性支持向量机实际当中大多数数据集都不是线性可分的，线性支持向量机主要是针对去掉少数样本之后线性可分样本数据集。线性不可分即意味着由少数样本点不能满足函数间隔大于等于1的约束条件，因此可以对每一个样本点加上一个松弛变量，并对每个松弛变量进行惩罚。于是原始问题变为：...
复制链接

扫一扫