对偶问题在SVM中的应用

最新推荐文章于 2022-12-20 23:06:58 发布

置顶边学边写

最新推荐文章于 2022-12-20 23:06:58 发布

阅读量287

点赞数 1

分类专栏：机器学习文章标签：支持向量机 svm 线性规划

本文链接：https://blog.csdn.net/weixin_43108465/article/details/104209963

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

理解支持向量机SVM过程遇到的对偶问题

最近在看周志华的西瓜书学习machine learning，看到支持向量机这一章的时候对其中的对偶问题部分真是百思不得其解，在查阅了一些资料后终于明白了其中的原理。
我先简述一下问题背景
在西瓜书中划分超平面所对应的基本问题为求解以下的非线性约束问题
$min_{w,b} \frac{1}{2}||w||^2\\ s.t. y_i(w^Tx^i+b)\geq1,i=1,2,...m\tag{1.1}$
则该问题的拉格朗日函数可以写为
$L(w,b,\alpha)=\frac{1}{2}||w||^2+\sum_{i=1}^m\alpha_i(1-y^i(w^Tx_i+b))\tag{1.2}$
令 ${1.2}$ 对 $w$ 和 $b$ 的偏导为零可得
$w=\sum_{i=1}^m\alpha_iy_ix_i\tag{1.3}$ $\\0=\sum_{i=1}^m\alpha_iy_i\tag{1.4}$
将 ${1.3}和{1.4}$ 代入1.2可得到式 $1.1$ 的对偶问题
$max_\alpha\sum_{i=1}^m\alpha_i-\frac{1}{2}\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jx_i^Tx_j\tag{1.5}$
那么这个 $1.5$ 是究竟是怎么来的呢？
首先我们假设 $f(w)=\frac{1}{2}||w||^2$
$g_i(w,b)=1- y_i(w^Tx^i+b),i=1,2..m$
问题变成
$min_{w,b}f(w)\\s.t.g_i(w,b)\leq=0\tag{2.1}$
其拉格朗日方程变为
$L(w,b,\alpha)=f(w)+\sum_{i=1}^m\alpha_ig_i(w,b)\tag{2.2}$
接下来我们正式推导公式 $1.5$
首先确立方程组
$\begin{cases}f(w)<v\\g_i(w,b)\leq0\end{cases}\tag{方程组1}$
让我们仔细思考一下，如果方程组1无解，则 $v$ 比我们要找的 $f (x)$ 的最小值还要小，也就是说v是问题的一个下界，问题转化为当方程组1无解时，找到 $v_{max}$ 。
我们首先考虑方程组1有解的情况
$方程组1有解\rightarrow\forall\alpha_i>0,L(w,b,\alpha)=f(w)+\sum_{i=1}^m\alpha_ig_i(w,b)<v有解$
根据逆否命题真值相同
$\exists\alpha_i>0,L(w,b,\alpha)=f(w)+\sum_{i=1}^m\alpha_ig_i(w,b)<v无解\rightarrow方程组1无解$
要使 $\exists\alpha_i>0,L(w,b,\alpha)<v无解$ ，
要满足 $L(w,b,\alpha)_{min}\geq v$
所以 $v_{max}=max_{\alpha_i>0}L_{min}(w,b,\alpha)=max_\alpha\sum_{i=1}^m\sum_{j=1}^m\alpha_i\alpha_jy_iy_jx_i^Tx_j\tag{1.5}$

得出最后结果，求解过程有点绕，大家可以画一下逻辑图来求解。

边学边写

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
对偶问题在SVM中的应用

理解支持向量机SVM过程遇到的对偶问题最近在看周志华的西瓜书学习machine learning，看到支持向量机这一章的时候对其中的对偶问题部分真是百思不得其解，在查阅了一些资料后终于明白了其中的原理。我先简述一下问题背景在西瓜书中划分超平面所对应的基本问题为求解以下的非线性约束问题minw,b12∣∣w∣∣2s.t.yi(wTxi+b)≥1,i=1,2,...m(1.1)min_{w,b...
复制链接

扫一扫

专栏目录