支持向量分类机(SVM)

最新推荐文章于 2024-01-03 12:00:18 发布

Petril

最新推荐文章于 2024-01-03 12:00:18 发布

阅读量332

点赞数

文章标签： svm

本文链接：https://blog.csdn.net/weixin_64618780/article/details/130135526

版权

1、硬间隔(hard-margin)

1)基础公式推导

口头禅：SVM有三宝：间隔对偶核技巧

分类：
$SVM\\soft-marginSVM\\kemel-marginSVM$
函数：
$f(x)=sign(w^Tx+b),判别模型$
距离样本点间隔最大

最大间隔分类器（max margin(w，b)):
$\begin{cases} s.t. w^Tx+b>0,y_i=1\\ w^Tx+b<0,y_i=-1 \end{cases}$
整合之后为：
$y_i*(w^Tx_i+b)>0,i=1,2,...,n,$
定义变量
$margin(w,b),distance(w.b,x_i),$
记
$\begin{cases} margin(w,b)=min~distance(w.b,x_i),i=1,2,...,n\\ =min~\frac{1}{||w||}|w^Tx_i+b|, \end{cases}$
则约束条件变为：
$\begin{cases} ~\max\min\frac{1}{||w||}y_i(w^T+b)=\max_{w.b}\frac{1}{w}\min y_i(w^Tx_i+b),\\ s.t.~y_i(w^Tx_i+b)>0\Rightarrow~\exists~\gamma>0,s.t.~\min y_i(w^T+b)=\gamma\\ \end{cases}$

$将\gamma按比例放缩为1，并代入方程，得\\ s.t.\begin{cases} \max_{w.b}\frac{1}{w}\min y_i(w^Tx_i+b)=\max\frac{1}{||w||}=\min\frac{1}{2}w^Tw\\ s.t.~y_i(w^Tx_i)\geq1~i=1,2,...,n \end{cases}$

以上就是几何意义的约束转化成数学表达式以及约束条件。

2)拉格朗日乘子

上一小节里构造出了最终的有约束条件，现在构造拉格朗日函数将有约束问题转化为无约束问题，具体操作为构造拉格朗日函数：
$L(w,b,\lambda)=\frac{1}{2}w^Tw+\sum_{i=1}^n\lambda_i(1-y_i(w^Tx_i+b_i))$
构造强对偶条件（1）、（2）分别为
$\begin{cases} \min_{w,b} \max_\lambda L(w,b,\lambda),\\ s.t.~\lambda_i\geq0 \end{cases} （1）\\ \begin{cases} \min_\lambda \min_{w,b}L(w,b,\lambda),\\ s.t.~\lambda_i\geq0 \end{cases}（2）$
对于条件（1），当
$1-y_i(w^Tx_i+b_i)>0时，\\ \max_\lambda L(w,b,\lambda) \rightarrow+\infty$
当
$1-y_i(w^Tx_i+b_i)\leq 0时，\\ \max_\lambda L(w,b,\lambda)=\frac{1}{2}w^Tw$
约束条件（1）变为
$min_{w,b}~\frac{1}{2}w^Tw~(1)$
对于条件（2），当
$令\frac{\partial }{\partial b}L(w,b,x) = 0,\\ 解得\sum_{i-1}^n\lambda_iy_i=0, \\代入L,得\\L_1(w,x)=\frac{1}{2}w^Tw+\sum_{i=1}^n\lambda_i-\sum_{i=1}^n\lambda_iy_iw^Tx_i,~~~(2.1)$
接着对L1求偏导，即
$\frac{\partial }{\partial w}L(w,x) = 0,\\ 解得w=\sum_{i=1}^n\lambda_iy_ix_i,~~~(2.2),\\ 将(2.2)代入L_1,得：\\ L_2=-\frac{1}{2}\sum_{i=1}^n\sum_{j=1}^n\lambda_i\lambda_jy_iy_jx_ix_j^T+\sum_{i=1}^n\lambda_i,~~(2.3)$
最终，条件（2)转化为
$\begin{cases} \min \frac{1}{2}\sum_{i=1}^n\sum_{j=1}^n\lambda_i\lambda_jy_iy_jx_ix_j^T-\sum_{i=1}^n\lambda_i,~~\\ s.t.~\lambda_i\geq0,\sum_{i=1}^n\lambda_iy_i=0. \end{cases}~(2)$

3)KKT条件

原强对偶问题具有强对偶关系的充要条件为KKT条件，即
$\begin{cases} \frac{\partial L }{\partial w} = 0,\frac{\partial L }{\partial b} = 0,\frac{\partial L }{\partial x} = 0,\\ \lambda_i(1-y_i(w^Tx_i+b))=0,~~~~~(3.1)\\ \lambda_i \geq0,\\ 1-y_i(w^Tx_i+b) \leq0. \end{cases}$
其中（3.1）为slackness complementary,

对于超平面
$w^Tx+b$
上一节已经解出
$w^*=\sum_{i=1}^n\lambda_iy_ix_i$
假设
$\exists (x_k,y_k),s.t.~1-y_k(w^Tx_k+b)=0.\\ 对此解得b^*=y_k-w^Tx_k=y_k-\sum_{i=1}^n\lambda_iy_ix_i$
最终得到决策函数
$f(x)=sign(w^{*T}x+b^*)$