（LXTML笔记）关于支持向量机[一]

本文链接：https://blog.csdn.net/qq_23997101/article/details/79366681

这里写图片描述
在之前的PLA分类中，实际上可行的解（线）是有很多种的，但是有的线不太好，如图第一行第一幅图所示，如果这条线很靠近某个（红色）的点时候，那么容错率较低，这里每个点的灰色圆表示的是，给它一个位置上的扰动即可能存在的位置，这样的话，显然图第一行的最后一幅图所给的线是比较好的（从这个角度上看）

注意到，灰色圆的半径最够大，实际上等价于这条线越“胖”，如图第二行所示。上面说的是SVM的基本思想。
这里写图片描述
由刚才的思想我们知道，实际上我们就是要最优化线的厚度即 $max_w\{margin(w)\}$ ，其中需要保证分类正确，即 $y_nw^Tx_n>0$ ，根据我们朴素的思想我们知道，我们这里的 $margin(w)$ ，实际上就是 $min_{n=1,2...,N}distance(x_n,w)$ ，即所有到这条线的最短距离，这是很好理解的。
这里写图片描述
由欧式空间中点到直线的距离我们有:

d i s r a n c e (x, b, w) = | w T x + b | | | w | |,

$disrance(x,b,w)=\frac{|w^Tx+b|}{||w||},$
为了简单起见（即想办法去掉绝对值）由正确分类条件

ynwTxn>0 y n w T x n > 0 $y_nw^Tx_n>0$ ，以及

yn y n $y_n$ 实际上是正负一（对值大小没有影响），我们可以重新定义一个距离，即

d i s r a n c e (x, b, w) = y n ( w T x + b ) | | w | |,

$disrance(x,b,w)=\frac{y_n(w^Tx+b)}{||w||},$
这样的话我们就能去掉绝对值，这对后面的讨论是很有帮助的。

接下来这一步，有种等价类划分的思想，和平常遇到的齐次性不妨设问题是类似的。
这里写图片描述
为了进一步简化最优化问题，我们考虑到实际上对于一条直线 $w^Tx+b=0$ ，两边同时乘上一个系数是不影响直线的表达的，但是这不是重点。我们来看现在的最优化问题中的 $margin$ ，对于任意的 $k \in R$