SVM中的对偶问题原理

0.摘要

本文仅从SVM的“对偶问题”出发去阐述优化求解问题中的数学原理。

1.“对偶原理”

1.1 原问题:

m i n i m i z e : f 0 ( x ) minimize: f_0(x) minimize:f0(x)
s . t . g i ( x ) , i = 1 , 2... , m s.t. \quad g_i(x),i=1,2...,m s.t.gi(x),i=1,2...,m
h j ( x ) , j = 1 , 2 , . . . n \qquad h_j(x),j=1,2,...n hj(x),j=1,2,...n
原问题在于将生活中的优化问题和其需要满足的条件以一般化的数学语言表达出来

1.2拉格朗日对偶问题:

L ( x , α , β ) = f ( x ) + α T g ( x ) + β T h ( x ) L(x,\alpha,\beta)=f(x)+\alpha^Tg(x)+\beta^Th(x) L(x,α,β)=f(x)+αTg(x)+βTh(x)
人为设定
1. α i > = 0 1.\alpha_i>=0 1.αi>=0
2. g ( α , β ) = i n f L ( x , α , β ) 2.g(\alpha,\beta)=infL(x,\alpha,\beta) 2.g(α,β)=infL(x,α,β)

1.3 对偶问题的对偶间隙

f ( x ∗ ) = m i n f ( x ) ≥ L ( x , α , β ) ≥ i n f L ( x , α , β ) = d ( α , β ) f(x^*)=minf(x)\geq L(x,\alpha,\beta)\geq infL(x,\alpha,\beta)= d(\alpha,\beta) f(x)=minf(x)L(x,α,β)infL(x,α,β)=d(α,β)
f ( x ∗ ) = P ∗ ≥ Q ∗ = d ( α ∗ , β ∗ ) f(x^*)=P^*\geq Q^*=d(\alpha^*,\beta^*) f(x)=PQ=d(α,β)
定义: g e p = P ∗ − Q ∗ gep = P^* - Q^* gep=PQ为对偶间隙,由此引发除了弱对偶定理和强对偶定理(strong duality).
定理:slater条件
在这里插入图片描述

  1. 任意问题的弱对偶均成立
  2. 对于部分问题的强对偶成立:凸优化问题成立,非凸优化问题部分成立

1.4KKT条件的推导

其中互补性的证明:
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值