拟凸函数一阶条件的证明

bigbinger

已于 2022-08-19 17:22:18 修改

阅读量5.6k

点赞数 7

分类专栏：凸优化机器学习文章标签：机器学习算法线性代数

于 2019-01-20 15:21:00 首次发布

本文链接：https://blog.csdn.net/wang136958280/article/details/86549034

版权

凸优化同时被 2 个专栏收录

5 篇文章

订阅专栏

机器学习

4 篇文章

订阅专栏

首先来看看拟凸函数的定义：函数 $f:R^n\to R$ 称为拟凸函数（或称单峰函数），如果其定义域及所有下水平集 $S_\alpha=\left\{ {x \in domf\left| {f\left( x \right) \leqslant \alpha } \right.} \right\}$ $\alpha \in R$ 都是凸集。从该定义可知，凸函数一定是拟凸函数，但拟凸函数不一定是凸函数（如函数 $f\left(x\right)=-e^x$ ）。
基本性质：函数 $f$ 是拟凸函数的充要条件是， $d o m f$ 是凸集，且对任意 $x,y\in domf$ 及 $0\leqslant\theta\leqslant1$ ,有 $f\left(\theta x+\left(1-\theta\right)y\right)\leqslant max\left\{f\left(x\right),f\left(y\right)\right\} \tag1$
拟凸函数的一阶条件：设函数 $f:R^n\to R$ 可微，则函数 $f$ 是拟凸的充要条件是： $d o m f$ 是凸集，且对任意 $x,y\in domf$ 有 $f\left(y\right)\leqslant f\left(x\right)\Rightarrow\nabla f{\left(x\right)^T}\left(y-x\right)\leqslant0 \tag2$
一阶条件的证明：
（1）必要性：设函数 $f:R^n\to R$ 可微，且 $d o m f$ 是凸集，对 $x,y\in domf$ 有 $f\left(y\right)\leqslant f\left(x\right)$ ,根据上面拟凸函数的基本性质有 $f\left(\theta x+\left(1-\theta\right)y\right)\leqslant max\left\{f\left(x\right),f\left(y\right)\right\}$ ，综合得： $f\left(\theta x+\left(1-\theta\right)y\right)\leqslant f\left(x\right) \tag3$ ,将 $f\left(x\right)$ 拆分为 $f\left(\theta x+\left(1-\theta\right)x\right)$ ,则（3）式变为 $f\left(\theta x+\left(1-\theta\right)y\right)\leqslant f\left(\theta x+\left(1-\theta\right)x\right) \tag4$
$f\left(\theta x+\left(1-\theta\right)y\right)-f\left(\theta x+\left(1-\theta\right)x\right)\leqslant0 \tag5$
将（5）式变为（6）式：
$f\left(\theta x+(1-\theta)x+\left(1-\theta\right)(y-x)\right)-f\left(\theta x+\left(1-\theta\right)x\right)\leqslant0 \tag6$
再将（6）式变成（7）式：
$\frac{{f\left( {\theta x +(1-\theta)x+ \left( {1 - \theta } \right)(y-x)} \right) - f\left( {\theta x + \left( {1 - \theta } \right)x}\right)}}{{\left( {1 - \theta } \right)\left( {y - x} \right)}}\left( {1 - \theta } \right)\left( {y - x} \right) \leqslant 0 \tag7$

对（7）式的第一项取极限 $\theta \to1$ 得： $\mathop {\lim }\limits_{\theta \to 1}\frac{{f\left( {\theta x +(1-\theta)x+ \left( {1 - \theta } \right)(y-x)} \right) - f\left( {\theta x + \left( {1 - \theta } \right)x}\right)}}{{\left( {1 - \theta } \right)\left( {y - x} \right)}}\left( {1 - \theta } \right)\left( {y - x} \right)=\nabla f{\left(x\right)^T}\left(y-x\right)\leqslant0$ .
（2）充分性：对任意的 $x,y\in domf$ ，以及 $\theta \in \left[0,1\right]$ ,假设 $f\left(y\right)\leqslant f\left(x\right)$ ，且 $\nabla f{\left(x\right)^T}\left(y-x\right)\leqslant0$ 。我们将证明： $f\left(\theta x+\left(1-\theta\right)y\right)-max\left\{f\left(x\right),f\left(y\right)\right\}\leqslant0 \tag8$ 如果（8）成立，则表示该函数是拟凸函数（注意前面拟凸函数的基本性质）。
首先我们证明 $\theta=0或\theta=1$ 的情况，当 $\theta=0$ 时， $f\left(\theta x+\left(1-\theta\right)y\right)=f\left(y\right)$ ,（8）式显然成立；当 $\theta=1$ 时， $f\left(\theta x+\left(1-\theta\right)y\right)=f\left(x\right)$ ,（8）式同样成立；
接下来我们证明 $\theta \in \left(0,1\right)$ 的情况，我们假设 $x\ne y$ (若 $x = y$ ,（8）式是显然成立的)，我们令 $z=\theta x+\left(1-\theta\right)y$ ，则我们要证明的（8）式变成 $f\left(z\right) \leqslant f\left(x\right)$ ，我们用反证法来证明：
假设 $f\left(z\right) > f\left(x\right)$ （此时 $f\left(z\right) > f\left(y\right)$ ），根据前面的命题假设，我们有 $\nabla f{\left(z\right)^T}\left(z-x\right)\leqslant0$ $\nabla f{\left(z\right)^T}\left(z-y\right)\leqslant0$ 将 $z=\theta x+\left(1-\theta\right)y$ 代入上面两个式子中得： $\left(1-\theta\right)\nabla f{\left(z\right)^T}\left(y-x\right)\leqslant0 \tag9$ $\theta\nabla f{\left(z\right)^T}\left(x-y\right)\leqslant0 \tag{10}$ 由于 $\theta \in \left(0,1\right)$ ,故由（9）、（10）式可得 $\nabla f\left(z\right)=0$ 。
我们知道 $z\in \left(x,y\right)$ , $f\left(z\right)>f\left(x\right)$ ,由于该函数是连续的，那么我们肯定可以找到一点 $z_1 \in \left(z,x\right)$ 使得 $f\left(z_1\right)>f\left(x\right)$ ，然后再次利用假设中的条件得到类似（9）、（10）式的结果，即 $\nabla f\left(z_1\right)=0$ ,一直重复上述步骤，我们将最终得到在 $\left(z,x\right)$ 之间的点的一阶导数都为0，这说明 $f\left(z\right)=f\left(x\right)$ ，所以假设 $f\left(z\right) > f\left(x\right)$ 不成立，则（8）式满足，所以命题得证。
————————————————————————————————
总结：拟凸函数一阶条件证明的关键在于构造出 $\nabla f{\left(x\right)^T}$ ，而这点我们可以根据导数的基本定义出发去构造。