机器学习(西瓜书)学习笔记6——支持向量机

一.首先讲两个概念:间隔和支持向量

        对于给定的训练集  D=\left \{ \left ( x_{1},y_{1} \right ) ,\left ( x_{2},y_{2} \right ) ,...,\left ( x_{m},y_{m} \right ) \right \}  ,分类学习的目的是在样本空间中找到一个划分超平面,将不同类别的样本分开。这个超平面可能有很多,哪个才是最好的?

 

                                                       

                                                                                            图1 

       由图1显示的例子,有两类样本,有很多个超平面可以将这两类样本完全分开,但是以我们自己的直觉看,处于两类样本中间的超平面应该会更好一些,因为该划分超平面对于训练样本局部扰动的容忍性最好。(现实中的数据距离超平面的距离会更近,在这种情况下,红色那条超平面是分类最准确的超平面),也就是说,这个超平面所产生的分类结果是最鲁棒的,对未见示例的泛化性能最强。

      在样本空间中,划分超平面可用如下线性方程来描述:

                                                                                     

       其中,\omega=\left (\omega _{1};\omega _{2}...;\omega _{d} \right )为法向量,决定了超平面的方向,b决定了超平面与原点间的距离。所以,超平面由法向量 \omega 和位移 b 确定。样本空间中任意点x到超平面 \left ( \omega ,b \right ) 的距离为:

                                                                                  

        假设超平面能将训练样本正确分类,即对于  \left ( x_{i},y_{i} \right )∈ D, 若 y_{i} =+1,则有  \omega ^{T}x_{i}+b> 0  ,若 y_{i} =-1,则有  \omega ^{T}x_{i}+b< 0  ,

令:

                                     要点 1    

上述公式是在SVM推导中第一个重要的公式。

                                              

        在图2中,距离超平面最近的这几个训练样本点使上式的等号成立,它们被称为支持向量,两个不同类支持向量到超平面的距离之和为

                                                            要点2   

它被称为“间隔”。可以看到,间隔只与超平面的法向量有关,与训练集无关。

我们的目的是要找到具有最大间隔的超平面,也就是要找到满足要点1中的W和b,使得\gamma值最大。即:

                      要点3     

由要点三可得:为了最大化间隔,只需将 ω 最小,于是,要点3可重写为:  

                                                      

这就是支持向量机的的基本型。

二、对偶问题

        我们需要求解式6.6中的 ω 和 b ,对式6.6使用拉格朗日乘子法可得到其对偶问题,具体来说,对式6.6的每条约束添加拉格朗日乘子ai>=0,该问题的拉格朗日函数可写为:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值