【西瓜书】第六章支持向量机---学习笔记

最新推荐文章于 2023-04-14 02:16:48 发布

qq_31514061

最新推荐文章于 2023-04-14 02:16:48 发布

阅读量167

点赞数

分类专栏：西瓜书文章标签：支持向量机学习机器学习

本文链接：https://blog.csdn.net/qq_31514061/article/details/125504114

版权

西瓜书专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1.间隔与支持向量

1.1算法原理：

对于线性可分数据集，从几何角度，支持向量机就是找距离正负样本都最远的超平面，相比于感知机，其解是唯一的，泛化性能更好。

1.2点 $x$ 到超平面的距离

$\frac{|w^Tx + b|}{||w||}$ ,
假设超平面 $(w, b)$ 能将训练样本正确分类，即对于 $(x_i,y_i)\in D$ ,则若 $y_i = +1$ ,有 $w^Tx_i + b >0$ ;则若 $y_i = -1$ ,有 $w^Tx_i + b <0$ ;
两个异类支持向量到超平面的距离之和为:
$\frac{2}{||w||}$
在这里插入图片描述
为了最大化间隔，仅需要最大化 $w||^{-1}$ 于是支持向量机的基本型为：

2.对偶问题

最大间隔划分超平面的模型：
$f(x) = w^T x + b$ ,其中 $w 和 b$ 是模型参数，对每条约束添加拉格朗日乘子 $\alpha_i \ge0$ 该问题的拉格朗日函数可写为：
$L(w,b,\alpha) = \frac{1}{2}||w||^2 + \sum\limits_{i=1}^n\alpha_i(1 - y_i(w^Tx_i + b))$
其中 $\alpha = (\alpha_1;\alpha_2;...;\alpha_m;)$ .令 $L(w,b,\alpha)$ 对 $w$ 和 $b$ 的偏导为零可得：
$\sum\limits_{i=1}^m\alpha_iy_ix_i$
消去 $w 和 b$ ,再考虑约束就可以得到对偶问题
$max_{\alpha} \sum\limits_{i=1}^m\alpha_i - \frac{1}{2}\sum\limits_{i=1}^m\sum\limits_{j=1}^m\alpha_i\alpha_jy_iy_jx_i^Tx_j$
在这里插入图片描述

3.核函数

现实中,"异或"问题不线性可分,如下图
在这里插入图片描述
解决方法:将样本从原始空间映射到一个更高维的特征空间,使得
样本在这个特征空间内线性可分.
令 $\phi(x)$ 表示将 $x$ 映射后的特征向量,于是,在特征空间中划分超平面所对应的模型可表示为
$w^T\phi(x) + b$
在这里插入图片描述
其对偶问题是:

求解后可得到

只要一个对称函数所对应的核矩阵半正定，它就能作为核
函数使用
此外，还可通过函数组合得到

4.软间隔与正则化

抛出问题:在现实任务中,往往很难确定合适的核函数使得训练样本在特征空间中线性可分.
解决办法:允许支持向量机在一些样本上出错,为此称为"软间隔"
在这里插入图片描述
$min_{w,b} \frac{1}{2}||w||^2 + C\sum\limits_{i=1}^m\ell_{0/1}(y_i(w^Tx_i +b) -1)$
其中C>0是一个常数, $\ell_{0/1}是损失函数$