Support Vector Machine

最新推荐文章于 2023-11-28 21:26:08 发布

bryant_meng

最新推荐文章于 2023-11-28 21:26:08 发布

阅读量241

点赞数 1

分类专栏： Machine Learning

本文链接：https://blog.csdn.net/bryant_meng/article/details/83422849

版权

24 篇文章 4 订阅

订阅专栏

1 SVM

在这里插入图片描述

首先我们想要最优化的是各类样本点到超平面的距离最远（其实也就是找到最大间隔超平面）。

样本点： $x$
超平面： $w^Tx+b=0$
样本点到超平面的距离：先看二维的情况，就是点 $x_0,y_0)$ 到直线 $A x + B y + C = 0$ 的距离
$\frac{|Ax_0+By_0 + C|}{\sqrt{A^2+B^2}}$
拓展到高维，就是点到超平面的距离：
$\frac{|w^Tx+b|}{||w||}$
其中， $\sqrt{w_1^2+w_2^2+...+w_d^2}$

有了距离的定义后，我们可以看如下的图：
在这里插入图片描述
发现，除了支持向量（离超平面最近的几个点）以外，其它的样本点到超平面的距离都大于 $d$ ，所以我们可以对所有样本点进行如下表示：

在这里插入图片描述
其中， $y_i =1$ 表示红色的样本点， $y_i=-1$ 表示蓝色的样本点！分母 $w^Tx_i + b$ 不带绝对值，在超平面下方的点代进去确实小于0。

我们来简化一下：

在这里插入图片描述
此处，

看能不能回答如下几个问题：

margin 的求法，1的由来（放缩）
min max L 中 max 由来（min max L 等价于带约束的最小值——目标函数）
min max L = max min L （强对偶）的由来（强对偶的等价条件是1.凸优化，2.满足 KKT条件）
min L 先求（w，b）最小值，之后 max 求 a 的最大值（二次规划方法），可以用 smo 方法，也可以用下面小例子¹的方法（max 转化为 min优化问题）

小例子：
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
$x^Ty$ ，涉及到内积，注意，先对x，y平方（核函数映射），然后再算内积，等价于先算内积再平方（核函数映射）

我们要把数据映射到高维，然后分开（目标函数中出现内积），等价于在低维先内积，再映射到高维
在这里插入图片描述
例如，高斯核函数，把每个样本变都映射成一个高斯分布

在这里插入图片描述

关注

专栏目录