为什么SVM最大化几何间隔等同于最小化||w||

这个问题困扰了笔者很久,今天终于弄明白了,记录一下,防止遗忘。

背景

SVM是一个二分类模型,目标是找到两个类别的最大间隔超平面。给定一组数据\left \{ \left ( x_{1}, y_{1} \right ), \left ( x_{2}, y_{2} \right, ..., \left ( x_{N}, y_{N} \right ) )\right \}, 其中y_{i} \in \left \{ -1, +1 \right \}

公式推导

首先引入两个概念:

函数间隔\gamma:所有样本点到超平面wx+b=0的最小距离。由于几何间隔会随着超平面参数的变化而变化,如果w和b同时增大两倍,函数间隔也会增大两倍,这样的话不同超平面的函数间隔无法作比较;

几何间隔\widehat{\gamma }:将超平面的参数的模设为1 时的函数间隔,也就是超平面\frac{w}{||w||}x + \frac{b}{||w||}=0对应的函数间隔。

为了求最大间隔超平面,目标函数定义为:

\left\{\begin{matrix} max\ \gamma \\ s.t. \ y_{i}(wx_{i}+b) \geq \gamma \end{matrix}\right.

由于不同超平面的函数间隔无法直接比较,引入几何间隔:

\left\{\begin{matrix} max\ \widehat{\gamma }\\ s.t. \ y_{i}(\frac{w}{\left \| w \right \|}x_{i}+\frac{b}{\left \| w \right \|})\geq \widehat{\gamma } \end{matrix}\right. \ \Rightarrow \left\{\begin{matrix} max\ \widehat{\gamma }\\ s.t. \ y_{i}(\frac{w}{\left \| w \right \|\widehat{\gamma }}x_{i}+\frac{b}{\left \| w \right \|\widehat{\gamma }})\geq 1 \end{matrix}\right.

 

w^{'} = \frac{w}{\left \| w \right \|\widehat{\gamma }}, \ b^{'} = \frac{b}{\left \| w \right \|\widehat{\gamma }},可得:

\left\{\begin{matrix} max\ \widehat{\gamma }\\ s.t. \ y_{i}(\frac{w}{\left \| w \right \|\widehat{\gamma }}x_{i}+\frac{b}{\left \| w \right \|\widehat{\gamma }})\geq 1 \end{matrix}\right. \Rightarrow \left\{\begin{matrix} max\ \widehat{\gamma }\\ s.t. \ y_{i}(w^{'}x_{i}+b^{'})\geq 1 \end{matrix}\right.

 

由于\left \|w^{'} \right \| = \frac{\left \|w \right \|}{\left \| w \right \|\widehat{\gamma }} = \frac{1}{\widehat{\gamma }},所以max\ \widehat{\gamma } \Leftrightarrow min\ \left \| w^{'} \right \|

 

最终的目标函数为:

\left\{\begin{matrix} min\ \left \| w^{'} \right \|\\ s.t. \ y_{i}(w^{'}x_{i}+b^{'})\geq 1 \end{matrix}\right. \Rightarrow \left\{\begin{matrix} min\ \frac{1}{2}\left \| w^{'} \right \|^2\\ s.t. \ y_{i}(w^{'}x_{i}+b^{'})\geq 1 \end{matrix}\right.

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值