Chapter 6 SVM

最新推荐文章于 2024-08-22 10:36:28 发布

Ethan//calf

最新推荐文章于 2024-08-22 10:36:28 发布

阅读量340

点赞数

分类专栏：瓜皮文章标签：西瓜书周志华支持向量机 SVM 对偶函数

本文链接：https://blog.csdn.net/qq_23129193/article/details/85068940

版权

本篇详细介绍了支持向量机（SVM）的概念，包括间隔、支持向量、对偶问题、核函数、软间隔与正则化。通过拉格朗日乘子法，SVM的对偶问题转化为二次规划问题，通过核技巧处理非线性可分情况。此外，还讨论了支持向量回归（SVR）和核方法在机器学习中的应用。

摘要由CSDN通过智能技术生成

#第六章支持向量机

6.1 间隔与支持向量机

分类学习最基本的想法就是基于训练集D再样本空间中找到一个最鲁棒的划分超平面。它可用如下线性方程来描述：
$w^Tx+b=0$
其中，w被称为法向量，可用于描述超平面的方向，b为位移项，决定超平面到原点的距离。显然这两项决定了划分超平面，可以证明样本空间中任意点 $\bf x$ 到超平面距离可写为：
$r=\frac{|w^T\bf x+b|}{||w||}$
若有超平面 $(w, b)$ 能将训练样本正确分类，那么距离该平面最近的几个训练样本点会使得
$\begin{cases}w^Tx_i+b\geq +1,&y_i=+1\\ w^Tx_i+b\leq -1,&y_i=-1\end{cases}$
那这样的几个训练样本点我们称其为“支持向量”，两个异类支持向量到超平面的距离之和称为"间隔"（margin）： $\gamma=2/||w||$ 。
为了找到间隔最大的划分超平面，也就是要求：
$max_{w,b} \quad\frac{2}{||w||}\\ s.t. y_i(w^T{\bf x_i}+b)\geq 1,i=1,2,...,m$
上面涉及的最大化 $w||^{-1}$ 等价于最小化 $w||^{2}$ ,即：
$min_{w,b}\quad \frac{1}{2}{||w||^2}\\ s.t. y_i(w^T{\bf x_i}+b)\geq 1,i=1,2,...,m\tag{6.1}$
这就是SVM的基本型

6.2 对偶问题

首先,我们要求（6.1）的话，这本身是一个凸优化的问题，显然能用现成的优化计算包求解，但还有更为高效的方法————拉格朗日乘子法，可得到其对偶问题：即对式（6.1）的每条约束添加一个拉格朗日乘子 $\alpha_i\geq0$ (不等式约束),那么该问题的朗格朗日函数可写为：
$L(w,b,\alpha)=1/2||w||^2+\sum_{i=1}^m\alpha_i(1-y_i(w^Tx_i+b))\tag{6.2}$
对 $L(w,b,\alpha)$ 求偏导为0，最后可得出（6.1）的对偶问题（下6.3），求解（6.2）中的拉格朗日算子：
$max_\alpha\ \ \ \sum_{i=1}^m\alpha_i-1/2\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jx_i^Tx_j\\ s.t \sum_{i=1}^m\alpha_iy_i=0,\\ \alpha_i\geq0,i=1,2,...,m\tag{6.3}$
求解该式是一个二次规划问题，但鉴于实际处理时，有时候样本数过大，导致通用的求解二次规划算法如拉格朗日等方法并不适用，为了避免障碍，人们通过利用问题本身的特性，提出如SMO（Sequential Minimal Optimization）等多种高效算法。

最终模型为： $f(x)=w^Tx+b=\sum_{i=1}^m\alpha_iy_ix_i^Tx+b$
注意，由于（6.1）中有不等式约束，所以上述过程还须满足KKT（Karchur-Kuhn-Tucker）条件：
$alpha_i\geq0;\\ y_if(x_i)-1\geq0;\\ \alpha_i(y_if(x_i)-1)=0.$
SMO基本思路：先选择两个变量 $\alpha_i$ 和 $\alpha_j$ 并固定其他参数，这样，在初始化参数后，不断执行以下步骤：

选取一对需更新的变量

最低0.47元/天解锁文章

Ethan//calf

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Chapter 6 SVM

#第六章支持向量机6.1 间隔与支持向量机分类学习最基本的想法就是基于训练集D再样本空间中找到一个最鲁棒的划分超平面。它可用如下线性方程来描述：wTx+b=0w^Tx+b=0wTx+b=0其中，w被称为法向量，可用于描述超平面的方向，b为位移项，决定超平面到原点的距离。显然这两项决定了划分超平面，可以证明样本空间中任意点x\bf xx到超平面距离可写为：r=∣wTx+b∣∣∣w∣∣r...
复制链接

扫一扫

专栏目录