监督学习：支持向量机（SVM）

最新推荐文章于 2024-04-19 00:19:04 发布

没头脑的无痛学习记录

最新推荐文章于 2024-04-19 00:19:04 发布

阅读量611

点赞数 3

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38791613/article/details/124133427

版权

本文介绍了支持向量机（SVM）的基本原理，包括其最大几何间隔思想和核技巧。SVM在线性可分、线性近似可分和非线性场景下的应用进行了阐述，强调了在非线性问题中如何通过核函数转化成线性问题。此外，还提及了SVM在解决复杂分类问题时的优势。

摘要由CSDN通过智能技术生成

概述

支持向量机（SVM）是一种常见的二分类模型。与感知机相比，支持向量机在两个方面做出了改进：

几何间隔最大化思想。因此SVM找到的分类超平面是唯一的，感知机的解根据初值的选择、训练数据的选择顺序会得到不同的无穷多个解。
核技巧。引入核技巧后，SVM可以扩展到非线性分类场景。

从简单的场景到复杂的场景理解SVM的原理，即：训练集线性可分、线性近似可分、线性不可分三种情况。

（SVM的背后涉及到拉格朗日对偶性、正定核等比较复杂的数学知识，这里只梳理一下SVM的原理和思路，更细节的部分如果以后碰到再回头细扣。）

一、几何间隔

设有一超平面 $(\omega ,b)$ ，它关于训练集T中的样本 $(x_{i},y_{i})$ 的几何间隔定义为：

$\gamma _{i}=y_{i}(\frac{\omega }{||\omega ||}\cdot x_{i}+\frac{b}{||\omega ||})$

其中 $x_{i}\in X =R^{n}$ ， $y_{i}\in Y=\left \{ +1,-1 \right \}$ 。

而超平面 $(\omega ,b)$ 到训练集的距离被定义为关于训练集的所有样本（样本总数为N）的最小几何间隔：

$\gamma =\underset{i=1,2,...,N}{min}\gamma _{i}$

（可以理解为超平面到训练集最近的样本的几何间隔，SVM最大化的就是这个间隔。）

二、线性可分SVM

SVM的思想是通过最大化几何间隔，将数据集中最难被分类的样本以足够大的置信度正确分类。

当训练集线性可分时，存在超平面将训练集中的所有数据正确分类，这种情况下的SVM就叫线性可分SVM：

线性可分SVM求解的优化问题表示为：

$\underset{\omega ,b}{max}\; \, \gamma$

$s.t. \; \, y_{i}(\frac{\omega }{||\omega ||}\cdot x_{i}+\frac{b}{||\omega ||})\geqslant\gamma,\; \; \; i=1,2,...,N$

它的等价优化问题写为下式（会比上面的公式更易求解，实际中也用的下式）：

$\underset{\omega ,b}{min}\; \; \frac{1}{2}||\omega ||^{2}$

$s.t. \; y_{i}(\omega \cdot x_{i}+b)-1\geqslant 0,\;\; \; i=1,2,...,N$

三、线性近似可分SVM

当训练集近似可分时，对每个样本 $(x_{i},y_{i})$ 引入一个松弛变量 $\xi _{i}\left ( \geqslant 0 \right )$ ，使得间隔加上这个松弛变量 $\geqslant 1$ ，并为每个松弛变量对应一个代价为 $\xi _{i}$ ，因此优化问题改写为：

$\underset{\omega ,b}{min}\; \; \frac{1}{2}||\omega ||^{2}+C\sum_{i=1}^{N}\xi _{i}$

$s.t. \; \; y_{i}(\omega \cdot x_{i}+b)\geqslant 1-\xi _{i},\;\; \; i=1,2,...,N$

线性近似可分时，SVM的策略如下：

四、非线性SVM

在非线性数据集上，SVM采取的思路是：

先用核函数将原空间的数据映射到新的空间，即将非线性问题转化为线性问题
在新的空间用上述线性方法（软间隔最大化）进行分类

核函数的作用是将非线性问题转化为线性问题，核函数做的事如下图所示：

在核函数的选择上，一般是依赖领域知识直接选择，常见的核函数有多项式核函数、高斯核函数等。

整个非线性SVM做的事如下图所示：

参考：

李航《统计学习方法（第2版）》

没头脑的无痛学习记录

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
监督学习：支持向量机（SVM）

对SVM的粗浅理解。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。