SVM(Support Vector Machine)读书笔记三(Soft-margin SVM)

最新推荐文章于 2022-03-22 19:19:39 发布

Jackie_Zhu

最新推荐文章于 2022-03-22 19:19:39 发布

阅读量1w

点赞数 2

分类专栏：机器学习文章标签：读书笔记 svm kernel

本文链接：https://blog.csdn.net/jackie_zhu/article/details/52097306

版权

本文探讨了硬间隔SVM在处理噪声数据时的过拟合问题，并介绍了软间隔SVM的概念，允许一定程度的误差以减少过拟合风险。通过引入松弛变量ξ，软间隔SVM成为了一个优化问题，通过Lagrange乘子法和核函数进行求解。实际应用中，如libSVM和Scikit-learn，调整C和γ参数至关重要，较小的值通常能带来更好的泛化能力。

摘要由CSDN通过智能技术生成

上两篇讲到了hard-margin的SVM以及kernel的原理，利用高斯kernel可以将低维空间转换到无穷维，将所有样本分开。但是如果数据中存在一定的噪声数据，SVM也会将噪声数据拟合，存在过拟合的风险。Soft-margin SVM原理就是让SVM能够容忍一定的噪声数据，以减少过拟合的风险。

Hard-margin过拟合问题

这里写图片描述
先看一下上面的相同数据集中的两个模型，左图中的模型能够容忍数据中存在一定噪声，而且在数据集上表示还可以；右图就是Hard-margin SVM，不能容忍数据集中的噪声，根据奥卡姆剃刀原理，明显左边的模型能更好的解释数据，右图的模型存在过拟合的风险。

Soft-margin SVM假设

这里写图片描述
为了让Hard-margin容忍一定的误差，在每个样本点后面加上了一个宽松条件，允许这个点违反一点点 $\xi$ 大小的误差（上图中的violation就是这个 $\xi$ ）,对于没有违反的点，则 $\xi$ 为0。同时为了最优化，需要最小化所有误差的和，因此在最小化的项后面加上了误差和。