间隔与支持向量
分类学习最基本的想法就是基于训练集在样本空间中找到一个划分超平面,将不同类别的样本分开。但能将训练样本分开的划分超平面可能有很多,应该找哪一个呢?
最直观的应该找正中间的超平面,它容忍度最高,鲁棒性最强。
在样本空间中,划分超平面可以通过如下方程式来描述:
![](https://i-blog.csdnimg.cn/blog_migrate/33097c516cdcf075b640beb3a392d2bd.png)
其中,W为法向量,决定超平面的方向。b为位移项,决定了超平面与原点的距离。样本空间中任意点X到超平面的距离可写为:
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/86f0c5962114f8801b8a95f8fde909d4.png)
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/6e32b68a0ddf3c36ae56eac99fbd7cb0.png)
距离超平面最近的这几个训练样本使得(6.3)成立,他们被称为支持向量,两个异类支持向量到超平面的距离之和被称为间隔为
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/9a426f8fdd7038e8cb89376dab6410a6.png)