SVM推导

最新推荐文章于 2020-08-21 12:47:55 发布

0ng

最新推荐文章于 2020-08-21 12:47:55 发布

阅读量128

点赞数

分类专栏：机器学习公式推导

本文链接：https://blog.csdn.net/weixin_43804251/article/details/107224506

版权

机器学习同时被 2 个专栏收录

13 篇文章 3 订阅

订阅专栏

公式推导

11 篇文章 1 订阅

订阅专栏

个人笔记，非教程

将两类样本用以下超平面进行划分

$w^Tx+b=0$

让所有样本都划分正确

$w^Tx_++b\geq 1, x_+\in 第一类数据,y_+=+1$
$w^Tx_-+b\leq -1, x_-\in 第二类数据,y_-=-1$

目标：找到最靠近划分超平面的数据 $x$ ， $x$ 到划分超平面的距离 $d$ ，最大化这个距离 $d$

$d=\frac{|w^Tx+b|}{||w||}$

$\max \frac{|w^Tx_++b|}{||w||}+\frac{|w^Tx_-+b|}{||w||}$

因为改变 $w$ 的长度来改变 $w^Tx+b|$ 的大小，所以我们可以固定 $w^Tx+b|=1$

$\max \frac{1}{||w||}+\frac{1}{||w||}=\frac{2}{||w||}$
等价于
$\min \frac 12 ||w||^2$

同理可以将划分标准改为
$w^Tx_++b\geq +1, x_+\in 第一类数据,y_+=+1$
$w^Tx_-+b\leq -1, x_-\in 第二类数据,y_-=-1$

上面二式可统一写为
$y_i(w^Tx_i+b)\geq 1$

最终目标

$\min_{w,b} \ \ \ \frac 12 ||w||^2$
$s.t.\ \ \ y_i(w^Tx_i+b)\geq 1$

拉格朗日

$L(w,b,\alpha)=\frac 12 ||w||^2+\sum_{i=1}^{N}\alpha_i(1-y_i(w^Tx_i+b))$
其中
$\alpha_i\geq 0,1-y_i(w^Tx_i+b)\leq 0$

$\frac{\partial L(w,b,\alpha)}{\partial w}=w+\sum_{i=1}^{N}\alpha_iy_ix_i$
$\frac{\partial L(w,b,\alpha)}{\partial b}=\sum_{i=1}^{N}\alpha_iy_i$

令偏导为零得

$w=\sum_{i=1}^{N}\alpha_iy_ix_i$
$\sum_{i=1}^{N}\alpha_iy_i=0$

代回 $L(w,b,\alpha)$ 中得

$\begin{aligned} L(w,b,\alpha)&=\frac 12 (\sum_{i=1}^{N}\alpha_iy_ix_i)^T(\sum_{j=1}^{N}\alpha_jy_jx_j)+\sum_{j=1}^{N}\alpha_j(1-y_j((\sum_{i=1}^{N}\alpha_iy_ix_i)^Tx_j+b)) \\ &=\frac 12 \sum_{i=1}^{N}\sum_{j=1}^{N}\alpha_i\alpha_jy_iy_jx_i^Tx_j+\sum_{i=1}^{N}\alpha_i-\sum_{i=1}^{N}\sum_{j=1}^{N}\alpha_i\alpha_jy_iy_jx_i^Tx_j-\sum_{i=1}^{N}\alpha_iy_ib \\ &=-\frac 12 \sum_{i=1}^{N}\sum_{j=1}^{N}\alpha_i\alpha_jy_iy_jx_i^Tx_j+\sum_{i=1}^{N}\alpha_i \end{aligned}$
$\ \ \ \sum_{i=1}^{N}\alpha_iy_i=0,\ \ \ \alpha_i\geq0$

定义 $\theta(w,b)=\max_{\alpha}L(w,b,\alpha)$

$\theta(w,b)= \begin{cases} \frac12 ||w||^2\ \ \ \forall x_i,1-y_i(w^Tx_i+b)\leq0\\ +\infty\ \ \ \exist x_i,1-y_i(w^Tx_i+b)>0 \end{cases}$

则最终目标

$\min_{w,b} \theta(w,b)=\min_{w,b} \max_{\alpha}-\frac 12 \sum_{i=1}^{N}\sum_{j=1}^{N}\alpha_i\alpha_jy_iy_jx_i^Tx_j+\sum_{i=1}^{N}\alpha_i$
$\ \ \ \sum_{i=1}^{N}\alpha_iy_i=0,\ \ \ \alpha_i\geq0$

软间隔SVM

采用hinge损失
$\xi_i=\max(0,1-y_i(w^Tx_i+b))$
$\min_{w,b} \ \ \ \frac 12 ||w||^2+C\sum_{i=1}^{N}\xi_i$
$s.t.\ \ \ y_i(w^Tx_i+b)\geq 1-\xi_i,\ \ \xi_i\geq 0$

拉格朗日

$L(w,b,\alpha,\xi,\mu)=\frac12||w||^2+C\sum_{i=1}^{N}\xi_i+\sum_{i=1}^{N}\alpha_i(1-y_i(w^Tx_i+b)-\xi_i)-\sum_{i=1}^{N}\mu_i \xi_i$
其中 $\alpha_i\geq 0$ , $\xi_i\geq 0$ ,为拉格朗日乘子

令 $L(w,b,\alpha,\xi,\mu)$ 对 $w,b,\xi_i$ 的偏导为零可得
$w=\sum_{i=1}^{N}\alpha_iy_ix_i$
$\sum_{i=1}^{N}\alpha_iy_i=0$
$C=\alpha_i+\mu_i$
代入 $L(w,b,\alpha,\xi,\mu)$ 得原目标函数的对偶问题
$\max_{\alpha}\sum_{i=1}^{N}\alpha_i-\sum_{i=1}^{N}\sum_{j=1}^{N}\alpha_i\alpha_jy_iy_jx_i^Tx_j$
$s.t.\ \ \ \sum_{i=1}^{N}\alpha_iy_i=0,\ \ \ 0\leq \alpha_i\leq C$

0ng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SVM推导

将两类样本用以下超平面进行划分wTx+b=0w^Tx+b=0wTx+b=0让所有样本都划分正确wTx++b≥0,x+∈第一类数据,y+=+1w^Tx_++b\geq 0, x_+\in 第一类数据,y_+=+1wTx++b≥0,x+∈第一类数据,y+=+1wTx−+b≤0,x−∈第二类数据,y−=−1w^Tx_-+b\leq 0, x_-\in 第二类数据,y_-=-1wTx−+b≤0,x−∈第二类数据,y−=−1目标：找到最靠近划分超平面的数据xxx，xxx到划分超平面的距离ddd，
复制链接

扫一扫