统计学习方法——支持向量机（二）

最新推荐文章于 2024-06-20 15:50:14 发布

你的名字5686

最新推荐文章于 2024-06-20 15:50:14 发布

阅读量211

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/wk19951125/article/details/88947984

版权

机器学习专栏收录该内容

29 篇文章 1 订阅

订阅专栏

统计学习方法——支持向量机

支持向量机（二）
- 线性支持向量机

支持向量机（二）

前面我们介绍了对于线性可分数据的线性可分支持向量机以及硬间隔最大化，下来我们来看写对于线性不可分数据集的线性支持向量机与软间隔最大化。

线性支持向量机

线性可分问题的支持向量机学习方法对于线性不可分训练数据无疑是不适用的，通常情况，将训练集中的奇异点去除，就会重新变为线性可分的。

为了解决线性不可分问题，为每个样本点 $\left( {{x_i},{y_i}} \right)$ 引入一个松弛变量 ${\xi _i} \ge 0$ ，使函数间隔加上松弛变量大于等于 $1$ 。约束条件变为：
${y_i}\left( {w \cdot {x_i} + b} \right) \ge 1 - {\xi _i}$
同时对每个松弛变量 ${\xi _i}$ 支付一个代价函数，则目标函数变为：
$\frac{1}{2}{\left\| w \right\|^2} + C\sum\limits_{i = 1}^N {{\xi _i}}$
其中 $C > 0$ 为惩罚参数。

线性不可分的线性支持向量机（软间隔最大化）
$\mathop {\min }\limits_{w,b,\xi } \frac{1}{2}{\left\| w \right\|^2} + C\sum\limits_{i = 1}^N {{\xi _i}}$
$s.t.\quad {y_i}\left( {w \cdot {x_i} + b} \right) \ge 1 - {\xi _i},\quad i = 1,2, \cdots ,N$
${\xi _i} \ge 0,\quad i=1,2,\cdots,N$
线性支持向量机
对于给定的线性不可分的训练数据集，通过求解凸二次规划问题，即软间隔最大化问题，得到的分离超平面为：
$w^*\cdot x+b^*=0$
以及相应的分类决策函数：
$f\left( x \right) = sign\left( {{w^*} \cdot x + {b^*}} \right)$
称为线性支持向量机。

学习的对偶算法

同样引入拉格朗日定理。

引入拉格朗日算子后的函数为：
$L\left( {w,b,\xi ,\alpha ,\mu } \right) = \frac{1}{2}{\left\| w \right\|^2} + C\sum\limits_{i = 1}^N {{\xi _i}} - \sum\limits_{i = 1}^N {{\alpha _i}\left( {{y_i}\left( {w \cdot {x_i} + b} \right) - 1 + {\xi _i}} \right)} - \sum\limits_{i = 1}^N {{\mu _i}{\xi _i}}$
其中 $\alpha_i \ge 0,\mu_i\ge 0$ 。
求解 $\mathop {\min }\limits_{w,b,\xi } L\left( {w,b,\xi ,\alpha ,\mu } \right)$
$\mathop {\min }\limits_{w,b,\xi } L\left( {w,b,\xi ,\alpha ,\mu } \right)= - \frac{1}{2}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _i}{\alpha _j}{y_i}{y_j}{x_i}{x_j}} + } \sum\limits_{i = 1}^N {{\alpha _i}}$
再求解 $\mathop {\min }\limits_{w,b,\xi } L\left( {w,b,\xi ,\alpha ,\mu } \right)$ 对于 $\alpha$ 的极大值，即得对偶问题：
$\mathop {\max - }\limits_\alpha \frac{1}{2}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {{\alpha _i}{\alpha _j}{y_i}{y_j}{x_i}{x_j}} + } \sum\limits_{i = 1}^N {{\alpha _i}}$
$\quad \sum\limits_{i = 1}^N {{\alpha _i}{y_i}} = 0$
${\alpha _i} - {\mu _i} = 0$
${\alpha _i} \ge 0$
${\mu _i} \ge 0,\quad i = 1,2, \cdots ,N$
求解方式： $w^*,b^*$ 与线性可分支持向量相同

支持向量

上面对偶问题得解 ${\alpha ^*} = {\left( {\alpha _1^*,\alpha _2^*, \cdots ,\alpha _N^*} \right)^T}$ 中对应于 $\alpha _i^* > 0$ 的样本点 $\left( {{x_i},{y_i}} \right)$ 的实例 $x_i$ 称为支持向量。
实例 $x_i$ 到间隔边界的距离为 $\frac{{{\xi _i}}}{{\left\| w \right\|}}$ 。
四种情况
- $\alpha _i^* < C$ ，则 ${\xi _i} = 0$ ，支持向量 $x_i$ 恰好落在间隔边界上
- $\alpha _i^* = C$ ， ${\xi _i} < 1$ ，则分类正确， $x_i$ 在间隔边界与分离超平面之间
- $\alpha _i^* = C$ ， ${\xi _i} = 1$ ，则 $x_i$ 在分离超平面上
- $\alpha _i^* = C$ ， ${\xi _i} > 1$ ，则 $x_i$ 位于分离超平面误分一侧

合页损失函数

线性支持向量机学习的另一种解释：

$\mathop {\min }\limits_{w,b,\xi } \frac{1}{2}{\left\| w \right\|^2} + C\sum\limits_{i = 1}^N {{\xi _i}}$
$s.t.\quad {y_i}\left( {w \cdot {x_i} + b} \right) \ge 1 - {\xi _i},\quad i = 1,2, \cdots ,N$
${\xi _i} \ge 0,\quad i=1,2,\cdots,N$

等价于最小化目标函数：
$\sum\limits_{i = 1}^N {{{\left[ {1 - {y_i}\left( {w \cdot {x_i} + b} \right)} \right]}_ + } + \lambda {{\left\| w \right\|}^2}}$
目标函数的第一项为经验损失或经验风险，函数
$L\left( {{y_i}\left( {w \cdot {x_i} + b} \right)} \right) = {\left[ {1 - {y_i}\left( {w \cdot {x_i} + b} \right)} \right]_ + }$
称为合页损失函数，下标“+”表示：
${\left[ z \right]_ + } = \left\{ \begin{array}{l} z,\quad z > 0\\ 0,\quad z \le 0 \end{array} \right.$

参考文献

《统计学习方法》

你的名字5686

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法——支持向量机（二）

统计学习方法——支持向量机支持向量机（二）线性支持向量机学习的对偶算法支持向量机（二）前面我们介绍了对于线性可分数据的线性可分支持向量机以及硬间隔最大化，下来我们来看写对于线性不可分数据集的线性支持向量机与软间隔最大化。线性支持向量机线性可分问题的支持向量机学习方法对于线性不可分训练数据无疑是不适用的，通常情况，将训练集中的奇异点去除，就会重新变为线性可分的。为了解决线性不可分问题，为每...
复制链接

扫一扫

专栏目录