SVM优化问题中的 kkt条件推导

Lsuper11

已于 2022-01-27 11:18:19 修改

阅读量670

点赞数

分类专栏：机器学习文章标签：支持向量机

于 2021-11-26 20:34:22 首次发布

本文链接：https://blog.csdn.net/Super5311/article/details/121566752

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

SVM kkt

SVM
一、SVM问题
二、Lagrange function
三. 求解如下函数
四. $L(w,b,\alpha)$ 的KKT 条件如下:

SVM

提示：以下是本篇文章正文内容，下面案例可供参考

一、SVM问题

$\begin{array}{l} \min \frac{1}{2}\|w\|^2\\ s.t.~~~ y_i(w^Tx_i+b\geq 1) \end{array}$

二、Lagrange function

**step 1.**约束罚上去

$L:(w,b,\alpha)=\frac{1}{2}\|w\|^2-\sum^{n}_{i=1}\alpha_i(y_i(w^Tx_i+b)-1))$

step 2. 分别对w,b求偏导得0
$\begin{array}{l} L_w(w,b,\alpha)=w-\sum\alpha_iy_ix_i=0;\\ L_b(w,b,\alpha)=-\sum\alpha_iy_i=0; \end{array}$
由上可得
$\begin{array}{l} w_i=\sum\alpha_iy_ix_i;\\ \sum\alpha_iy_i=0; \end{array}$

setp 3 将上面两式代入 $L(w,b,\alpha)$ 得
$L(w,b,\alpha)=-\frac{1}{2}\sum^n_{i=1}\sum^n_{j=1}\alpha_i\alpha_jy_iy_j(x_i^Tx_j)+\sum^n_{i=1}\alpha_i;$

三. 求解如下函数

step 1.
$\begin{array}{l} \min_\alpha~~ \frac{1}{2}\sum^n_{i=1}\sum^n_{j=1}\alpha_i\alpha_jy_iy_j(x_i^Tx_j)-\sum^n_{i=1}\alpha_i;\\ s.t. ~~\sum^n_{i=1}\alpha_iy_i=0,\\ ~~~~~~~~~\alpha\geq0, ~~~~~~~~~~~~~~~i=1,....,n \end{array}$
可简化表达如下

$\begin{array}{l} \min_\alpha~~ \frac{1}{2}\alpha^TQ\alpha-\alpha;\\ s.t. ~~y^T\alpha=0,\\ ~~~~~~~~~0\leq\alpha\leq C, ~~~~~~~~~~~~~~~i=1,....,n \end{array}$
where (线性) $Q=y_iy_j(x_i^Tx_j)$ ；
（非线性引入核函数） $Q=y_iy_jkernerl_{RBF}<x_i,x_j>$ ；

step 2. 将约束罚上去得
$h(\alpha)=\frac{1}{2}\alpha^TQ\alpha-\alpha-\mu\alpha y-\delta\alpha+\beta(\alpha-C)$
按分量看
kkt条件

h对 $\alpha$ 求导得0
$h_{\alpha}=Q\alpha -1-\mu_i y_i-\delta_i+\beta_i=0$ ;
令 $g(\alpha,\mu)=Q\alpha -1-\mu_i y_i$
简化表达 $h_{\alpha}=g(\alpha,\mu)-\delta_i+\beta_i=0$ ;
乘子大于等于0
$\delta_i\geq0$ ;
$\beta_i\geq0$ ;
互补条件（乘子*约束=0，即三种情况1.乘子等于0，2.约束等于0，3.乘子约束同时等于0）
$\delta_i\alpha_i=0$ ;
$\beta_i(\alpha_i-C)=0$ ;

case 1. $\alpha=0$ 时
由 $\delta_i\alpha_i=0$ 和 $\alpha=0$ ，可得 $\delta_i\geq0$ .
由 $\beta_i(\alpha_i-C)=0$ 和 $\alpha=0$ , 可得 $\beta_i(-C)=0$ ,又因为C>0, 可得 $\beta_i=0$ .
由 $h_{\alpha}=g(\alpha,\mu)-\delta_i+\beta_i=0$
有 $h_{\alpha}=g(\alpha,\mu)-\delta_i+0=0$
$g(\alpha,\mu)=\delta_i\geq0$
即当 $\alpha=0$ 时, $g(\alpha,\mu)\geq0$ .

case 2. $0<\alpha< C$ 时
由 $\delta_i\alpha_i=0$ 和 $\alpha\neq0$ ，可得 $\delta_i=0$ .
由 $\beta_i(\alpha_i-C)=0$ 和 $0<\alpha< C$ , 可得 $(\alpha_i-C)\neq0$ ,可得 $\beta_i=0$ .
由 $h_{\alpha}=g(\alpha,\mu)-\delta_i+\beta_i=0$
有 $h_{\alpha}=g(\alpha,\mu)-0+0=0$
$h_{\alpha}=g(\alpha,\mu)=0$
即当 $0<\alpha< C$ 时, $g(\alpha,\mu)=0$ .

case 3. $\alpha=C$ 时
由 $\delta_i\alpha_i=0$ 和 $\alpha=C$ ，可得 $\delta_i=0$ .
由 $\beta_i(\alpha_i-C)=0$ 和 $\alpha=0$ , 可得 $(\alpha_i-C)=0$ , 可得 $\beta_i\geq0$ .
由 $h_{\alpha}=g(\alpha,\mu)-\delta_i+\beta_i=0$
有 $h_{\alpha}=g(\alpha,\mu)-0+\beta_i=0$
$g(\alpha,\mu)=-\beta_i\leq0$
即当 $\alpha=C$ 时, $g(\alpha,\mu)\leq0$ .

四. $L(w,b,\alpha)$ 的KKT 条件如下:

$\begin{array}{l} \alpha=0 ,~~~~~~~~~~~ g(\alpha,\mu)\geq0\\ 0<\alpha< C, ~~ g(\alpha,\mu)=0\\ \alpha=C, ~~~~~~~~~ g(\alpha,\mu)\leq0\\ \end{array}$

上文中的 $g(\alpha,\mu)$
$\begin{array}{l}=Q\alpha -1-\mu_i y_i\\=y_iy_j(x_i^Tx_j)\alpha -1- y_i\mu_i\\ =y_i(y_j(x_i^Tx_j)\alpha-\mu_i)-1 \end{array}$ 还有的论文中令 $f(x_i)=y_j(x_i^Tx_j)\alpha-\mu$ ,即 $g(\alpha,\mu)=y_if(x_i)-1$
则有

在这里插入图片描述

Lsuper11

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SVM优化问题中的 kkt条件推导

SVM的kkt条件SVM一、SVM问题二、Lagrange function求解如下函数综上SVM的kkt条件：SVM提示：以下是本篇文章正文内容，下面案例可供参考一、SVM问题min⁡12∥w∥2s.t.   yi(wTxi+b≥1)\begin{array}{l}\min \frac{1}{2}\|w\|^2\\s.t.~~~ y_i(w^Tx_i+b\geq 1)\end{array}min21∥w∥2s.t.  &nb.
复制链接

扫一扫