西瓜书——支持向量机svm原型推导

第一次听说支持向量机这个名词或许有点懵,这好像有点难以理解这个算法到底是干什么的。其实svm这个算法这个算法是用来分类的。目的是找到一个超平面然后把一堆数据划分成不同类别。映射到二维数据上面,那个超平面就是一条线了。如下图所示:在这里插入图片描述

我们也能看到有很多的线可以划分这两类数据,那我们的目的就是要找一条类似与红色线的划分线。为什么呢?因为这样红线划分的时候划分更清晰,两边留出的“空隙”更多,更平均。因为我们在实际数据中会有很多的噪声(不合理数据),像红色线那样的划分超平面就会对样本的“容忍”性最好,更专业一点的说法就是鲁棒性最好,对未见示例的泛化能力最强。

1、间隔

w T x + b = 0 w^Tx+b=0 wTx+b=0,该方程用来表示超平面。由欧式几何知识可知(了解即可),空间中任意一点到超平面的距离 r r r
r = ∣ w T x + b ∣ ∣ ∣ w ∣ ∣ r=\frac{|w^Tx+b|}{||w||} r=wwTx+b
我们一般对绝对值这个符号不怎么感冒,所以我们可以再将式子转换一下。
r = y i ( w T x i + b ) ∣ ∣ w ∣ ∣ , y i ∈ ( − 1 , + 1 ) r=\frac{y_i(w^Tx_i+b)}{||w||},y_i\in{(-1,+1)} r=wyi(wTxi+b),yi(1,+1)
( x i , y i ) (x_i,y_i) (xi,yi)就代表一个样本。 y i y_i yi就代表类别种类。

2、间隔最大化

为了让鲁棒性更强,我们就要间隔最大化。

d = m i n ( r ) = m i n y i ( w T x i + b ) ∣ ∣ w ∣ ∣ d = min(r) = min\frac{y_i(w^Tx_i+b)}{||w||} d=min(r)=minwyi(wTxi+b)其实 d d d就是离超平面最近的那一点离超平面的距离。
为了让间隔最大化就需要 m a x ( d ) max(d) max(d),所以我们就可以得到
γ = m a x ( 2 d ) , y i ( w T x i + b ) ∣ ∣ w ∣ ∣ ≥ d , d > 0 \gamma=max(2d), \frac{y_i(w^Tx_i+b)}{||w||}≥d,d>0 γ=max(2d),wyi(wTxi+b)d,d>0
看着这个式子还是比较复杂,还能再简练一点。
再令 d ^ = ∣ ∣ w ∣ ∣ d \widehat{d}=||w||d d =wd
γ = m a x 2 d ^ ∣ ∣ w ∣ ∣ , y i ( w T x i + b ) ≥ d ^ , d ^ ≥ 0 \gamma=max\frac{2\widehat{d}}{||w||},y_i(w^Tx_i+b)≥\widehat{d},\widehat{d}≥0 γ=maxw2d ,yi(wTxi+b)d ,d 0
又因为 d ^ \widehat{d} d 只是一个常数,所以它的取值完全不会影响最优化时 w , b w,b w,b的求解。那么我们可以将 d ^ \widehat{d} d 设置为1.
所以, γ = m a x 2 ∣ ∣ w ∣ ∣ , y i ( w T x i + b ) ≥ 1 , d ^ ≥ 0 \gamma=max\frac{2}{||w||},y_i(w^Tx_i+b)≥1,\widehat{d}≥0 γ=maxw2,yi(wTxi+b)1,d 0为了下一步求解更方便,我们将 γ \gamma γ转成一个凸函数的形式,这样我们就可以利用拉格朗日乘子法去求解凸优化问题了。 γ = m a x ∣ ∣ w ∣ ∣ 2 2 , y i ( w T x i + b ) ≥ 1 , d ^ ≥ 0 \gamma=max\frac{||w||^2}{2},y_i(w^Tx_i+b)≥1,\widehat{d}≥0 γ=max2w2,yi(wTxi+b)1,d 0
至此,svm的原型推导就结束了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值