分类：支持向量机(三)——软间隔最大化

最新推荐文章于 2024-06-11 02:53:31 发布

hgz_dm

最新推荐文章于 2024-06-11 02:53:31 发布

阅读量1.6k

点赞数 1

分类专栏：算法与模型文章标签：分类支持向量机软间隔最大化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huguozhiengr/article/details/88355373

版权

在支持向量机系列的前两篇中，介绍了一下完全线性可分向量机的构建过程，本篇将在此基础上介绍一下不完全线性可分的情况下实现支持向量机软间隔最大化过程。

1.线性分类时的两种情况

情况一：

考虑下面这张图中的情况，这些数据点是完全线性可分的，蓝色点与绿色点两类，分割线为紫色实直线

如果按完全线性可分的情况考虑，也可以实现，但是这样得到的分类间隔(紫色虚线间距)比较小，换句话说就是分类准确率不够高，模型泛化能力不够。现在考虑这样一种做法，我们在建模时先不考虑其中一个绿色类点(带叉号的点)，然后对剩余的、完全线性可分的点创建最优分类超平面，这样就得到红色实线，而此时的分类间隔(红色虚线间距)就比之前大得多，我们也有理由相信此时得到的SVM泛化能力更好。

情况二：

考虑下图中的这种情况，此时数据点不能完全线性可分

如果此时先不考虑带叉号的两个点，那么剩下的数据就完全线性可分了，我们可以找出红色实线那样的分类间隔。

2.软间隔最大化

对第1节中的两种情况，只要找出了影响最优分类超平面构建、“捣乱的数据点”(带叉号的点)，就可以解决我们的问题，所以我们要考虑将哪些点视为“捣乱的数据点”，在完全线性可分的情况下，所有的数据点均满足

$y(w^{T}x+b)\geq 1$

而在存在“捣乱数据点”的情况下，并不能保证所有的数据点满足上述等式，为此为每个数据点各自引入一个松弛变量 $\xi$ ， $\xi \geq 0$ ，使其满足

$y(w^{T}x+b)\geq 1-\xi$

很明显，如果 $\xi$ 足够大，那么所有的数据点均满足上述等式条件了，所以此时需要考虑松弛变量的影响、调整优化目标函数

$min \frac{1}{2}\left \| w \right \|^{2}+C\sum_{i=1}^{n}\xi _{i}$

式中为惩罚参数，用于权衡 “ 最大化分类间隔距离 ” 和 “ 分类误差 ” ，一般在构建模型前确定，越大，那么最终确定的分类间隔距离越小；越小，那么最终确定的分类间隔距离越大。这样最终的优化问题表述如下

$min \frac{1}{2}\left \| w \right \|^{2}+C\sum_{i=1}^{n}\xi _{i}$

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分类：支持向量机(三)——软间隔最大化

在支持向量机系列的前两篇中，介绍了一下完全线性可分向量机的构建过程，本篇将在此基础上介绍一下不完全线性可分的情况下实现支持向量机软间隔最大化过程。1.线性分类时的两种情况情况一：考虑下面这张图中的情况，这些数据点是完全线性可分的，蓝色点与绿色点两类，分割线为紫色实直线 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。