二分类支持向量机模型SVM知识点详解

最新推荐文章于 2024-08-26 21:20:43 发布

墨岚❤️

最新推荐文章于 2024-08-26 21:20:43 发布

阅读量1.9w

点赞数 13

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LY_ysys629/article/details/72980834

版权

本文全面介绍支持向量机（SVM）的基础知识，包括模型假设、线性与非线性分类、间隔最大化原理、拉格朗日对偶问题、KKT条件和SMO算法。并通过Python实现SVM模型，帮助读者从理论到实践理解SVM。

摘要由CSDN通过智能技术生成

1 引言

在本篇博客中，你将会了解到支持向量机分类器名字的由来、它的基本假设、支持向量机针对线性可分、广义线性、非线性情况下的解决方法以及一些具体的推导过程，支持向量机常见问题的解答。在本篇博客的第二部分会给一幅支持向量机整个过程的流程图，从图中你可以清晰的了解到支持向量机模型针对不同情况的的创建和求解过程，以及他们之间的关系，在图中涉及到的关键细节知识，会在第三部分给出详细的说明。因此，即使你之前没有接触过SVM，在你认真读了该篇博客也会有一个清晰的支持向量机建模框架。在本篇博客的最后将会给出支持向量机SVM从建模到求解整个过程的python实现代码及测试结果。废话不多说，开启你的学霸模式吧~

2 SVM全流程示意图

下图主要展示了，支持向量机构建时原问题，对偶问题及求解过程

二分类支持向量机框图

2.1 图说三种分类情况
图一展示了线性可分情况，如图所示，图二展示了存在少量误分类点的线性可分情况，图三展示了非线性分类情况。

线性可分情况

图1 线性可分情况

这里写图片描述

图2 线性不完全可分情况
非线性情况

非线性情况

图2非线性可分情况

2.2 7条说明详细解释SVM的关键知识点

说明1 –SVM的基本假设：

SVM模型是由少量几个样本点决定的，这几个样本点称为支持向量，支持向量距离超平面的距离是小于等于1的（原因后边有解释），假如SVM能够找出一个超平面或者超曲面使得支持向量能够尽可能的分类正确，且距离超平面或超曲面的距离尽可能的远，则非支持向量点，也能被正确分类且距离最远，该处距离的含义可认为分类正确的置信度，距离越远置信度越大。

说明2 –SVM的模型描述：

SVM模型超平面描述为： $\pmb{w}*\pmb{x}+b=0$
决策函数 $f(x)=sign(\pmb{w}*\pmb{x}+b)$
为什么说策略是间隔最大？接下来会给出答案。
首先提一下两个概念：函数间隔和几何间隔（上述假设中的距离）
函数间隔： $\hat{\gamma}_i=y_i(\pmb{w}*x_i+b)$
几何间隔： $\gamma_i =\frac{\hat{\gamma}}{||\pmb{w}||}$
（想象下点到线的距离,分类正确时， $y_i(\pmb{w}*x_i+b)=||\pmb{w}*x_i+b||$ ）
假设，分类超平面已经确定，此时要找出距离超平面最短的样本点（支持向量点），可描述为：
$\gamma=\min\limits_{i=1,2,...,n}\gamma_i=\min\limits_{i=1,2,...,n}\frac{\hat{\gamma}}{||\pmb{w}||}$
根据假设，求该距离最大化时的超平面参数 $\pmb{w},b$ ,描述为：
$\max\limits_{\pmb{w},b} \gamma$ 等价于 $\max\limits_{\pmb{w},b} \frac{\hat{\gamma}}{||\pmb{w}||}$

$max w w, b γ ^ | | w w | | s . t . y i (w w * x i + b) \geq γ^i = 1, 2, . . ., n, (1)$ $\begin{equation} \begin{array}{lc} \qquad\qquad\max\limits_{\pmb{w},b} \frac{\hat{\gamma}}{||\pmb{w}||} & \\ s.t.\quad y_i(\pmb{w}*x_i+b) \ge \hat{\gamma} \qquad i=1,2,...,n, & \\ \end{array} \tag{1} \end{equation}$
由于 $\hat{\gamma}$ 对求解优化问题无影响，因此可令其为1 $\hat{\gamma}=1$ 证明如下：
假设超平面参数为 $\pmb{w}^*,b^*$ ,支持向量样本点为 $(x_{min},y_{min})$ ,则支持向量的函数间隔为
$γ^= y m i n (w w * x m i n + b *) (2)$ $\begin{equation} \hat{\gamma}=y_{min}(\pmb{w}^*x_{min}+b^*)\tag{2} \end{equation}$
由于超平面同时缩放所有参数不会改变，所以令 ww∗=w

最低0.47元/天解锁文章

关注

13
点赞
踩
74

收藏

觉得还不错? 一键收藏
打赏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

墨岚❤️ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。