李宏毅机器学习——学习笔记（18）Support Vector Machine（SVM）

最新推荐文章于 2025-03-06 10:38:00 发布

青芒·1

最新推荐文章于 2025-03-06 10:38:00 发布

阅读量497

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/m0_37757740/article/details/89207307

版权

机器学习专栏收录该内容

17 篇文章

订阅专栏

本文深入探讨了SVM（支持向量机）的工作原理，包括HingeLoss函数的作用及其实现二分类的过程。对比了SVM与DeepLearning在特征转换上的不同，详细解释了LinearSVM的梯度下降过程，以及KernelFunction如何简化计算并提高效率。同时，介绍了几种常见的Kernel函数，如RBF和SigmoidKernel，并讨论了它们在复杂数据集上的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Hinge Loss + Kernel Method 就是SVM。

hinge loss

进行二分类的过程中，采取sigmoid和cross entropy的原因是gradient descent的梯度很大，利于参数调整。
在这里插入图片描述
Hinge loss function就是：
图中的紫色段，hinge loss 和cross entropy的差别在于对于预测准确后的样本的奖赏程度。

Linear SVM：hinge loss在某些位置是不可微分的，但是类似于relu函数

在这里插入图片描述
Linear SVM进行gradient descent

另外一种形式的SVM：两种形式可以互相进行转化，由于是最小化loss function，所以红色方框中两个式子是一致的。

在这里插入图片描述
由于w每次都是加减data point的linear combination，所以当我们最终w的值就是数据点的linear combination。如果使用hinge loss的话，偏微分的值可能为0，也就是说某些数据点不会加入到w中。只有某些数据点上对w才有影响，这些数据点可以作为support vector

在这里插入图片描述
通过对w用x进行表示，可以对f(x)的函数形式进行更改，最终可以表示成Dual representation的形式。

用kernel函数代替内积，在训练过程中，只需要kernel值就可以优化，求解a的值

kernel函数，x变换成Φ(x)以后进行的操作，可以先在x上进行该操作，在进行Φ(x)操作即可。
在这里插入图片描述直接计算Kernel(x,z)，比“特征转换+内积”的速度要快的多

基于RBF（径向基函数）的核函数，能够将样本映射到无限维的空间中。