【机器学习】SVM中对函数间隔和几何间隔的理解

最新推荐文章于 2025-04-21 15:43:46 发布

jinzhou742

最新推荐文章于 2025-04-21 15:43:46 发布

阅读量2k

点赞数

分类专栏：机器学习文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/Elford/article/details/121493152

版权

机器学习专栏收录该内容

3 篇文章

订阅专栏

该博客探讨了支持向量机（SVM）中的超平面表达式和几何间隔概念。通过函数间隔和几何间隔的转换，SVM的目标是最大化几何间隔的最小值。在不同的常数γ下，超平面的表示会改变，但分类精度保持不变，只是空间尺度有所调整。最终，SVM优化问题转化为一个凸二次规划问题，寻找最佳分类边界。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

超平面表达式：
在这里插入图片描述

函数间隔 ：对于在超平面上的点， $w x + b = 0$ 恒成立。而超平面之外的点，可以认为距离越远， $w x + b$ 的绝对值越大，同时分类成功的概率也越高，表达式为：
![在这里插入图片描述](https://img-blog.csdnimg.cn/15f20549a9e943d2a66edc5dc44ebdc6.png

几何间隔 ：顾名思义，几何间隔就是两条平行线之间的距离，表达式为：
在这里插入图片描述

考虑SVM的目标，是要使所有样本点中几何间隔的最小值尽可能大：
在这里插入图片描述

即最优化问题为：
在这里插入图片描述

将约束条件的左右两边同时乘以 $∣ ∣ w ∣ ∣$ ，可以得到表达式： $y_i(w·x_i+b)≥γ·||w||$

可以发现此时左边是函数间隔的表达式，回到函数间隔的本身意义，它表示空间中任一点到分类超平面 $w·x_i+b=0$ 的相对距离，如果对超平面表达式两边乘以一个系数，相当于对该平面作一个线性空间的映射，例如将 $2 x + 2 = 0$ 的两端同时乘以 $0.5$ ，得到 $x + 1 = 0$ ，表示新的基底向量下的平面空间。

相应的，空间中任一点到该平面的相对距离也会成比例增加或者减小。因此，对于 $y_i(w·x_i+b)≥γ·||w||$ ，相当于对于此超平面，空间中任一点到它的相对距离是 $γ \cdot ∣ ∣ w ∣ ∣$ 。 假设我们站在上帝视角已经得到了一个超平面 $w·x_i+b=0$ ，不妨对此超平面做一个映射，也就是令两端同时除以系数 $γ \cdot ∣ ∣ w ∣ ∣$ ，映射到新的线性空间，那么点与平面的相对距离也是同时映射过去的，换句话说，映射操作不对点到平面的相对距离发生变化，因此可以在一开始就令 $γ \cdot ∣ ∣ w ∣ ∣ = 1$