凸优化 [2]：什么是凸函数——一阶与二阶条件

最新推荐文章于 2023-10-22 10:45:54 发布

CSJ_CH3COOK

最新推荐文章于 2023-10-22 10:45:54 发布

阅读量3.7k

点赞数 1

分类专栏：凸优化与非线性规划文章标签：凸函数线性代数

本文链接：https://blog.csdn.net/weixin_44618103/article/details/104289739

版权

凸优化与非线性规划专栏收录该内容

4 篇文章 7 订阅

订阅专栏

凸优化 [2]：什么是凸函数——一阶与二阶条件

定义： $\forall x,y\in X$ ， $\forall \alpha \in [0,1]$ 使得：
$\begin{aligned} f(\alpha x+(1-\alpha)y)\le \alpha f(x)+(1-\alpha)f(y)&&\text{convex}\\ f(\alpha x+(1-\alpha)y)< \alpha f(x)+(1-\alpha)f(y)&&\text{strictly convex} \end{aligned}$
凸函数扩充到 $R^n$ 中：
$\tilde f(x)=\begin{cases} f(x)&\text{if $x\in X$}\\ \infty&\text{otherwise} \end{cases}$

凸函数：函数为凸的条件

一阶充要条件：

$f(x)\ge f(y)+\nabla f(y)^T(x-y)$

必要性：

由凸性可得：
$\begin{aligned} f((\alpha x - \alpha y) + y)&\le \alpha f(x)+(1-\alpha)f(y)\\ \Downarrow \Downarrow\\ \alpha f(x)&\ge f(\alpha (x-y) + y)-(1-\alpha) f(y) \end{aligned}$
两端除以 $\alpha$ ：
$f(x)\ge \frac{f(\alpha (x-y) + y)-(1-\alpha) f(y)}{\alpha}=f(y)+\frac{f(y+\alpha (x-y))- f(y)}{\alpha}$
因为：（由一阶 Taylor 展开）
$\lim_{\alpha\rightarrow 0} \frac{f(y+\alpha (x-y))- f(y)}{\alpha}=\frac{f(y)+\alpha \nabla f(y)^T(x-y)- f(y)}{\alpha}=\nabla f(y)^T(x-y)$
因此：
$f(x)\ge f(y)+\nabla f(y)^T(x-y)$
得证 $\square$

充分性：

令 $z=\theta x+(1-\theta)y$
$f(x)\ge f(z)+\nabla f(z)^T(x-z)\\ f(y)\ge f(z)+\nabla f(z)^T(y-z)$
则：
$\theta f(x)+(1-\theta)f(y)\ge\left[\theta f(z)+\theta\nabla f(z)^T(x-z)\right]+\left[(1-\theta) f(z)+(1-\theta)\nabla f(z)^T(y-z)\right]\\ \Downarrow\\ \theta f(x)+(1-\theta)f(y)\ge f(z)$
因此有：
$\theta f(x)+(1-\theta)f(y)\ge f(\theta x+(1-\theta)y)$
得证 $\square$

二阶充要条件：

$\nabla^2 f(x) \succeq 0$

充分性：

由二阶 Taylor 展开：
$f(y)=f(x)+\nabla f(x)^T (y-x) + \frac{1}{2}(y-x)^T \nabla^2f(x)(y-x)+o(\|y-x\|^2)$
因为 $\nabla^2 f(x) \succeq 0$ ，恒成立：
$\frac{1}{2}(y-x)^T \nabla^2f(x)(y-x)\ge 0$
因此：
$f(y)\ge f(x) +\nabla f(x)^T(y-x)$
由一阶条件，推出 $f$ 为凸函数。 $\square$

必要性：

由二阶 Taylor 展开：
$f(y)=f(x)+\nabla f(x)^T (y-x) + \frac{1}{2}(y-x)^T \nabla^2f(x)(y-x)+o(\|y-x\|^2)$
已知函数 $f$ 为凸函数，则由一阶充要条件：
$f(y)\ge f(x)+\nabla f(x)^T (y-x)$
因此：
$\frac{1}{2}(y-x)^T \nabla^2f(x)(y-x)+o(\|y-x\|^2)\ge 0$
Taylor 展开余项可忽略，因此 Hessian 矩阵要满足 $\forall (y-x)\in \R^n$ 都成立，因此 $\nabla^2f(x)\succeq 0$ 。