七、支持向量机（Support Vector Machine, SVM）

最新推荐文章于 2022-09-02 10:23:41 发布

cute_Lily

最新推荐文章于 2022-09-02 10:23:41 发布

阅读量547

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/coffee_cream/article/details/108723624

版权

本文详细介绍了支持向量机（SVM），包括其作为线性分类器的基本思想，通过最大化间隔来找到最佳分类超平面。讨论了对偶问题和KKT条件，重点解析了SMO算法用于优化求解α的过程。此外，还探讨了带有松弛变量的SVM以处理不可分样本，并比较了SVM与逻辑回归的异同。最后，提到了非线性SVM和核函数的应用。

摘要由CSDN通过智能技术生成

支持向量机（Support Vector Machine, SVM）是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；当把核引入到SVM中后，它就成为了非线性分类器。

SVM的的学习策略就是间隔最大化，可形式化为一个求解凸二次规划的问题，也等价于正则化的合页损失函数的最小化问题。SVM的的学习算法就是求解凸二次规划的最优化算法。

1 线性分类器

给定训练样本集 $D=\{({\bf x}_1,y_1),({\bf x}_2,y_2),\cdots,({\bf x}_m,y_m)\},y_i \in \{ -1, +1\}$ ，分类学习最基本的想法就是基于训练集 $D$ 在样本空间中找到一个划分平面，将不同类别的样本分开。在样本空间中，用如下的线性方程来描述划分超平面：

${\bf w}^T{\bf x}+b=0$

其中， ${\bf w}=(w_1;w_2;\cdots;w_d)$ 为法向量，决定了超平面的方向； $b$ 为位移量，决定了超平面与原点之间的距离。划分平面可被法向量 ${\bf w}$ 和位移 $b$ 确定，就将该平面记为 $({\bf w},b)$ ，样本空间中任意点 ${\bf x}$ 到超平面 $(w, b)$ 的距离可以写为：

$r=\frac{|{\bf w}^T{\bf x}+b|}{||{\bf w}||}$

我们知道，对于平面 $({\bf w},b)$ ，同比例变化 ${\bf w}$ 和 $b$ 时该平面不变，因此，我们可以找到一组 $({\bf w},b)$ 使得距离该平面最近的样本点（即支持向量）满足 $|{\bf w}^T{\bf x}_i+b| = 1$ （目的：为了求解时计算方便）。

假设超平面 $({\bf w},b)$ 能将训练样本正确分类，令 $f({\bf x})={\bf w}^T{\bf x}+b$ ，对于 $({\bf x}_i,y_i)\in D$ ，有：

$\begin{cases} {\bf w}^T{\bf x}_i+b \geq +1 & y_i=+1\\ {\bf w}^T{\bf x}_i+b \leq -1 & y_i=-1 \end{cases}$

如下图所示，距离超平面最近的几个训练样本点使上式成立，它们称为“支持向量”（support vector），两个异类支持向量到超平面的距离之和为：

$\gamma = \frac{2}{||{\bf w}||}$

它被称为 “间隔”（margin）
在这里插入图片描述

如果想要找到具有“最大间隔”（maximum margin）的划分超平面，也就是要找到使得 $\gamma$ 最大的、能满足的条件约束的参数 ${\bf w}$ 和 $b$ ：

$\begin{aligned} \max_{ {\bf w}, b} & \ \ \frac{2}{||{\bf w}||}\\ s.t & \ \ y_i({\bf w}^T{\bf x}_i+b) \geq1, \ i=1,2,\cdots,m \end{aligned}$

显然，为了最大化间隔，仅需最大化 $||{\bf w}||^{-1}$ ，这就等价于最小化 $||{\bf w}||^{2}$ ，于是，该目标可以重写为：

$\begin{aligned} \min_{ {\bf w}, b} & \ \ \frac{1}{2}{\|{\bf w}\|^2}\\ s.t & \ \ y_i({\bf w}^T{\bf x}_i+b) \geq1, \ i=1,2,\cdots,m \end{aligned}$

2 对偶问题

目标函数本身是一个凸二次规划（Convex Quadratic Programming）问题，利用拉格朗日乘子法可得到其“对偶问题”（dual problem），对每条约束添加拉格朗日乘子 $\alpha_i \geq 0$ ，则该问题的拉格朗日函数可写作：

$L({\bf w},b,\alpha)=\frac{1}{2}{||{\bf w}||^2} + \sum_{i=1}^m \alpha_i (1-y_i({\bf w}^T{\bf x}_i+b))$

最低0.47元/天解锁文章

cute_Lily

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
七、支持向量机（Support Vector Machine, SVM）

支持向量机（Support Vector Machine, SVM）是一种二分类模型，它的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机；当把核引入到SVM中后，它就成为了非线性分类器。SVM的的学习策略就是间隔最大化，可形式化为一个求解凸二次规划的问题，也等价于正则化的合页损失函数的最小化问题。SVM的的学习算法就是求解凸二次规划的最优化算法。...
复制链接

扫一扫