【机器学习】SVM基础知识+代码实现

最新推荐文章于 2024-06-15 17:38:09 发布

maershii

最新推荐文章于 2024-06-15 17:38:09 发布

阅读量1.2k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/u013166817/article/details/84840900

版权

本文介绍了SVM的基础知识，包括最大化支持向量到超平面的距离、线性可分与非线性可分情况下的处理，重点讲解了SMO算法的优化过程，以及核函数在处理非线性数据中的作用。并提供了代码实现的参考资源。

摘要由CSDN通过智能技术生成

1. 基本知识

二分类：通过分离超平面对数据点进行分类，训练分离超平面。

原理：最大化支持向量到分离超平面的距离。支持向量：离分离超平面最近的点。

2. 完全线性可分（硬间隔）

2.1 SVM基本型

分离超平面： w^Tx + b 。（训练中更新w和b，或alpha，使得分离超平面分类效果最佳）

某点到分离超平面的函数距离： $y_i(w^T\mathbf{x}_i + b)$

某点到分离超平面的几何距离： $\frac{y_i(w^T\mathbf{x}_i + b)}{||w||}$ , ||w||为w的L2范数。

点集到分离超平面的几何距离 => 距离超平面最近的点到其的距离： $\min_{n}{\frac{y_i(w^T\mathbf{x}_i + b)}{||w||}}$

SVM的目标：

$arg\max_{w,b}\min_{n}{\frac{y_i(w^T\mathbf{x}_i + b)}{||w||}}$

引入约束条件，假设所有点到超平面的距离都大于等于1，其中里分离超平面距离为1的点称为‘支持向量’（即等号成立时的点）。则问题转化为：

$arg\max_{w,b}{\frac{1}{||w||}}, \ y(w^T\mathbf{x}+b) \geq 1$

$arg\min_{w,b}{\frac{1}{2}}||w||^2, \ y(w^T\mathbf{x}+b) \geq 1$

2.2 对偶问题

求解： $arg\min_{w,b}{\frac{1}{2}}||w||^2, \ y(w^T\mathbf{x}+b) \geq 1$ ，以求得分离超平面，为凸二次规划问题。

引入拉格朗日乘子 $\alpha_i \geq 0$ ，则拉格朗日函数为：

$L(w,b,\alpha) = \frac{1}{2}||w||^2 + \sum_{i=1}^{n}\alpha_i(1-y_i(w^T\mathbf{x}_i + b) ) , \ \alpha \geq 0$

$L(w,b,\alpha) = \frac{1}{2}||w||^2 - \sum_{i=1}^{n}y_i(w^T\mathbf{x}_i + b) + \sum_{i=1}^n\alpha_i, \ \alpha \geq 0$

分别对w，b求偏导，使导数为零：

$\\w = \sum_{i=1}^n\alpha_i y_i \mathbf{x}_i \\0 = \sum_{i=1}^n \alpha_iy_i$

将w和b由alpha表示，并添加约束条件，最后使得问题转化为：

$\\ {\color{DarkBlue} \max_{\alpha} -\frac{1}{2}\sum_{i=1}^n\sum_{j=1}^n\alpha_i\alpha_jy_iy_j(\mathbf{x}_i ^T\mathbf{x}_j) + \sum_{i=1}^n\alpha_i } \\ {\color{DarkBlue} s.t. \ \ \alpha\geq 0, \ \sum_{i=1}^n\alpha_iy_i = 0}$

最后得到：

$f(\mathbf{x}) = \mathbf{w}^T\mathbf{x}+b = \sum_{i=1}^n\alpha_iy_i\mathbf{x}_i \mathbf{x} + b$

上述过程满足KKT条件：

$\\KKT: \\ {\color{DarkBlue} \alpha_i \geq 0} \\ {\color{DarkBlue} y_if(\mathbf{x}_i) \geq 1} \\ {\color{DarkBlue} \alpha_i(y_if(\mathbf{x}_i)-1) = 0 }$

上述KKT条件说明，当alpha为0时，对应的数据点不参与w的计算，而当alpha不为0时， $y_if(\mathbf{x}_i)$ 为1，说明这些点到分离超平面距离为1，为支持向量。这说明：训练完成后，只需要保留支持向量的样本即可。

3. SMO算法

SMO：sequential minimal optimization 序列最小优化。优化求解alpha。

基本思路：固定 $\alpha_i$ 之外的所有参数，然后求 $\alpha_i$ 上的极值。由于约束条件： $\sum_{i=1}^n\alpha_iy_i = 0$ ，则固定 $\alpha_i$ 之外的其他变量后， $\alpha_i$ 可以直接求解。

实验步骤：

step1：选取一对需要更新的 $\alpha_i$ ， $\alpha_j$ &#x

最低0.47元/天解锁文章

maershii

关注

1
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】SVM基础知识+代码实现

1. 基本知识二分类：通过分离超平面对数据点进行分类，训练分离超平面。原理：最大化支持向量到分离超平面的距离。支持向量：离分离超平面最近的点。2. 完全线性可分（硬间隔）2.1 SVM基本型分离超平面：。（训练中更新w和b，或alpha，使得分离超平面分类效果最佳）某点到分离超平面的函数距离：某点到分离超平面的几何距离：, ||w||为w的L2范数。点集到分离...
复制链接

扫一扫

专栏目录