拉格郎日函数

最新推荐文章于 2023-07-26 17:34:12 发布

prupcognition

最新推荐文章于 2023-07-26 17:34:12 发布

阅读量193

点赞数

分类专栏：凸优化机器学习算法

本文链接：https://blog.csdn.net/m0_37896765/article/details/91365852

版权

机器学习算法同时被 2 个专栏收录

17 篇文章 0 订阅

订阅专栏

凸优化

3 篇文章 0 订阅

订阅专栏

1:拉格郎日函数
对于问题：
$min \ f_0(x)$
$f_i(x) \leq 0 \ i=1,2...,n$
$h_i(x)= 0 \ i=1,2...,n$
注意这里没有指定函数是凸函数
对应的拉格郎日函数写为
$L(x,\lambda,v)=f_0(x)+\displaystyle \sum_{i=1}^n \lambda_i f_i(x) + \displaystyle \sum_{i=1}^n v_i h_i(x) \ ,\lambda \in R^n,v \in R^n$

2:拉格郎日对偶函数：
$g(\lambda,v)=min L(x,\lambda,v)$
表示在给定x的情况下的关于 $\lambda,v$ 的最小值函数
性质1： $g(\lambda,v)$ 是凹函数
性质2： $\forall \lambda \geq 0 ,对于\forall v,有g(\lambda,v) \leq p^*,p^*是原拉格郎日函数的最优解$

3：对偶问题：
$\begin{cases} max \ g(\lambda,v)=\max \min L(x,\lambda,v) \\ \lambda \geq 0 \end{cases}$
是凸问题，因为最大化凹函数等于最小化凸函数，自变量 $\lambda 满足凸集的定义$
令对偶问题最优解为 $d^*$
原问题最优解为 $p^*$
当满足 $d^*=p^*$ 时，称为强对偶， $d^* \leq p^*$ 为弱对偶

4：鞍点：
对于任意函数 $f (w, z)$ ,一定有下列不等式成立：也叫弱对偶关系
$\displaystyle \max_z \min_w \ f(w,z) \leq \displaystyle \min_w \max_z\ f(w,z)$
证明：
下列不等式恒成立：
$\displaystyle \min_w \ f(w,z) \leq \ f(w,z) \quad : w作为自变量$
$\displaystyle \ f(w,z) \leq \max_z \ f(w,z) \quad : z作为自变量$
所以有：
$\displaystyle \min_w \ f(w,z) \leq \max_z \ f(w,z)$
令
$\displaystyle \min_w \ f(w,z)=\alpha(z) \quad :\alpha(z)是关于z的函数$
$\displaystyle \max_z \ f(w,z)=\beta(w) \quad :\beta(w)是关于w的函数$
所以有下列不等式恒成立
$\alpha(z) \leq \beta(w)$
也就有：
$\displaystyle \max_z \alpha(z) \leq \displaystyle \min_w \beta(w)$
$\displaystyle \max_z \min_w \ f(w,z) \leq \displaystyle \min_w \max_z\ f(w,z)$
证明完毕

如果等式成立，并且 $w, z$ 取值相同的点称作鞍点
对于原问题：
$\ L(x,\lambda,v)= \begin{cases} \infty :\ 当 \lambda < 0 \\ L(x,\lambda,v) :\ 当 \lambda \geq 0 \end{cases}$
所以有下列关系成立
$L(x,\lambda,v) = \begin{cases} \min \max L(x,\lambda,v) \\ \lambda \geq 0 \end{cases}$

鞍点定理：
$若w^*,z^*是函数f(w,z)的鞍点，则强对偶关系存在p^*=d^*,并且该点是$
$原问题和对偶问题的最优解$

5：当原问题是凸问题时，基本上满足slater 条件，从而满足 $d^*=p^*$

slater 条件是充分条件

6：KKT条件: $令：x^*, \lambda^*,v^*$ 是原问题最优解，如果所有函数一阶可微，
并且满足 $d^*=p^*,一定会有下列条件成立$
$\begin{cases} f_i(x^*) \leq 0 \\ h_i(x^*) = 0 \quad 前两条保证原问题满足约束\\ \lambda^* \geq 0 \quad 保证对偶问题满足约束\\ \lambda_i f_i(x^*) =0 \quad 互补松弛条件\\ \nabla f_0(x^*)+\displaystyle \sum_{i=1}^n \lambda_i \nabla f_i(x^*) + \displaystyle \sum_{i=1}^n v_i \nabla h_i(x^*)=0 \quad 满足凸函数性质\ \end{cases}$

必要性证明：已知条件： $d^*=p^*,x^*, \lambda^*,v^*是原问题最优解$
必然有
$\begin{cases} f_i(x^*) \leq 0 \\ h_i(x^*) = 0 \\ \lambda^* \geq 0 \\ \end{cases}$
前两条表示原问题有可行解，最后一条表示对偶问题有可行解
又因为 $d^*=p^*$
所以有： $f_0(x^*)=g(\lambda^*,v^*)$
$\ L(x,\lambda^*,v^*)$
$\ (f_0(x)+\displaystyle \sum_{i=1}^n \lambda_i^* f_i(x) + \displaystyle \sum_{i=1}^n v_i^* h_i(x))$
$\leq f_0(x^*)+\displaystyle \sum_{i=1}^n \lambda_i^* f_i(x^*) + \displaystyle \sum_{i=1}^n v_i^* h_i(x^*)$
$f_0(x^*)$
所以 $\lambda_i^* f_i(x^*)=0成立$
又因为所有函数可微，那么我们知道函数的极值点是导数为0的点，所以会满足
$\nabla f_0(x^*)+\displaystyle \sum_{i=1}^n \lambda_i^* \nabla f_i(x^*) + \displaystyle \sum_{i=1}^n v_i^* \nabla h_i(x^*)=0$
必要性证明完毕

6：充分性：
$令：x^*, \lambda^*,v^*原问题最优解，如果所有函数一阶可微，$
$并且所有函数都是凸函数，则KKT条件是d^*=p^*的充分必要条件$

prupcognition

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
拉格郎日函数

1:拉格郎日函数对于问题：min f0(x)min \ f_0(x)min f0(x)fi(x)≤0 i=1,2...,nf_i(x) \leq 0 \ i=1,2...,nfi(x)≤0 i=1,2...,nhi(x)≤0 i=1,2...,nh_i(x) \leq 0 \ i=1,2...,nhi(x)≤0 i=1,2....
复制链接

扫一扫