『ML笔记』SVM笔记3软间隔手写详细推导

目录

一、下面手推导具体的过程:

二、综合整理所有:


  • 线性可分问题的支持向量机学习方法,对线性不可分训练数据是不适应的,因为这时上一节中不等式约束不能成立,如何扩展到线性不可分问题呢?这就需要修改硬间隔最大化,使其成为软间隔最大化。
  • 通常情况下训练数据中有一些特异的点,将这些特异的点去处后,剩下的样本组成的集合是线性可分的。线性不可分的意思就是某些样本点不能满足函数间隔大于等于1的约束条件。为了解决这个问题,可以对每个样本点 \left\{x_{i}, y_{i}\right\} 引入一个松弛变量 \xi_{i} \geq 0 ,使函数间隔加上加上松弛变量大于等于1,这样约束条件变为:

                                                                         \large {y}_{i}(w^T x_i+b) \geqslant 1-\xi_{i}

  • 同时,对每个松弛变量 \xi_{i} ,支付一个代价 \xi_{i},目标函数由原来的 \frac{1}{2}\|w\|^{2}变为:

                                                                               \large \frac{1}{2}\|w\|^{2}+C \sum_{i}^{N} \xi_{i}

  • 将约束项变形:\xi_{i} \geqslant 1- {y}_{i}(w^T x_i+b);我们有:

                                                    \large \begin{aligned} J(w) &=\frac{1}{2}\|w\|^{2}+C \sum_{i} \max \left(0,1-{y}_{i}(w^T x_i+b)\right) \\ &=\frac{1}{2}\|w\|^{2}+C \sum_{i} L_{H i n g e}\left(m_{i}\right) \end{aligned}

  • 其中:L\left(m_{i}\right)=\max \left(0,1-m_{i}(w)\right),表示如果被正确分类,损失是0,否则损失就是 1-m_{i}(w)
  • 这里的C>0称为惩罚参数(权重),一般由应用问题决定,C值大时对误分类的惩罚增大,C值小时对误分类的惩罚减小。

                                                                \large \begin{array}{cl}{\min _{w, \xi, b}} & {\frac{1}{2} w^{T} w+C \sum_{1}^{N} \xi_{i}} \\ {\text { s.t. }} & {y_{i}\left(w^{T} x_{i}+b\right) \geq 1-\xi i \quad \xi_{i} \geq 0}\end{array}

  • 我们要求的目标函数的最小值,在引进松弛变量和惩罚参数有两个含义
  • ①使 \frac{1}{2}\|w\|^{2} 尽量小,也就是间隔尽量大;
  • ②同时使得松弛变量 \xi_{i} 尽量小,也就是误分类的点个数尽量小;

一、下面手推导具体的过程:

注意:惩罚因子C的补充解释:在这里讨论一下惩罚因子C,当C无穷大的时候,会发生什么呢?C无穷大的时候,还要最小化下面式子:

很显然需要下面这一项等于0:

也就是一个样本也不允许出错。所以说C越大,允许出错的样本越小,模型的复杂福越高,越容易过拟合,所以当SVM过拟合的时候,适当减小惩罚因子C,可以减小过拟合问题!

松弛变零的理解可以参考本文:SVM入门(八)松弛变量 ;下面如若有不对的地方还望指正。

二、综合整理所有:

尤其注意:L2-SVM的对偶形式和L1-SVM对偶形式的区别。

SVDD的对偶形式:

可以参考下:https://blog.csdn.net/wsp_1138886114/article/details/82459928

  • 6
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI大模型前沿研究

感谢您的打赏,我会继续努力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值