西瓜书第六章-支持向量机

最新推荐文章于 2022-03-31 13:58:27 发布

孤鸿末子

最新推荐文章于 2022-03-31 13:58:27 发布

阅读量218

点赞数

分类专栏：机器学习文章标签：支持向量机机器学习 svm 深度学习

本文链接：https://blog.csdn.net/qq_42832437/article/details/119226392

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

间隔与支持向量

给定训练样本集 D,分类学习最基本的想法就是基于训练、集在样本空间中找到一个划分超平面、将不同类别的样本分开但能将训练样本分开的划分超平面可能有很多，如图 6.1所示，我们应该努力去找到哪一个昵?

在这里插入图片描述

在样本空间中，划分超平面可通过如下线性方程来描述:
$w^t+b=0$
样本空间中任意点 $x$ 到超平面 $(w, b)$ 的的距离可写为:
$r=\frac{|w^tx+b|}{||w||}$
假设超平面 $(w, b)$ 的能将训练样本正确分类，即对于 $(x_i,y_i) \in D$
若 $y_i=+1$ ,则有 $w^Tx_i+b>0$ ;若 $y_i=-1$ ，则有 $w^Tx_i+b<0$ .令
在这里插入图片描述
如图 6.2 所示，距离超平面最近的这几个训练样本点使上式的等号成立,它们被称为"支持向量" (support vector) ，两个异类支持向量到超平面的距离之和为:
$\gamma = \frac{2}{||w||}$
它被称为间隔：

欲找到具有"最大|间隔" (maximum margin) 的划分超平面，也就是要找
到能满足式上式中约束的参数w和b, 使得 $\gamma$ 最大，即
在这里插入图片描述
显然，为了最大化间隔，仅需最大化 $w||^{-1}$ ，这等价于最小化 $w||^2$ 于是，(6. 5)的可重写为

这就是支持向量机(Support Vector Machine ，简称 SVM) 的基本型.

在这里插入图片描述

对偶问题

我们希望求解式(6.6) 来得到大间隔划分超平面所对应的模型：
$f(x)=w^tx+b$
对式(6.6) 使用拉格朗日乘子法可得到其"对偶问题" (dual problem).
体来说，对式(6.6) 的每条约束添加拉格朗日乘子 $\alpha_i≥0$ ，则该问题的拉格朗日函数可写为：

在这里插入图片描述
其中 $\alpha = (\alpha_1;\alpha_2;...;\alpha_m)$ ,令 $L(w,b,\alpha)$ 对w和b求导，的偏导为零可得

将式(6.9) 代人(6.8) ，即可将 $L(w,b,\alpha)$ 中的 w和b消去，再考虑式(6.10) 的约束，就得到式(6.6) 的对偶问题：

解出 $\alpha$ 后，求出w与b即可得到模型：
在这里插入图片描述

软间隔与正则化

软间隔;
在这里插入图片描述
具体来前面介绍的支持向量机形式是要求所有样本均满足约束(6.3)所有样本都必须划丘确，这称为"硬间隔" ，而软隔则是允许某些样本不满足约束:

当然，在最大化间隔的同时，不满足约束的样本应尽可能少.于是，优化目标可写为:
在这里插入图片描述
三种损失函数；

这就是常用的"软间隔支持向量机"