数学分析(六)-微分中值定理及其应用05：函数的凸性与拐点

最新推荐文章于 2025-04-29 15:32:57 发布

2401_82833469

最新推荐文章于 2025-04-29 15:32:57 发布

阅读量1.1k

点赞数 20

分类专栏：数学分析文章标签：概率论机器学习算法

本文链接：https://blog.csdn.net/2401_82833469/article/details/135884755

版权

§ 5 函数的凸性与拐点
读者已经熟悉函数 $f(x)=x^{2}$ 和 $f(x)=\sqrt{x}$ 的图像.
它们不同的特点是: 曲线 $y=x^{2}$ 上任意两点间的弧段总在这两点连线的下方;
而曲线 $y=\sqrt{x}$ 则相反,任意两点间的弧段总在这两点连线的上方.
我们把具有前一种特性的曲线称为凸的,
相应的函数称为凸函数;后一种曲线称为凹的,相应的函数称为凹函数.
定义 1 设 $f$ 为定义在区间 $I$ 上的函数, 若对 $I$ 上的任意两点
$x_{1}, x_{2}$ 和任意实数 $\lambda$ $\in(0,1)$ , 总有
$f\left(\lambda x_{1}+(1-\lambda) x_{2}\right) \leqslant \lambda f\left(x_{1}\right)+(1-\lambda) f\left(x_{2}\right),$
则称 $f$ 为 $I$ 上的凸函数. 反之, 如果总有
$f\left(\lambda x_{1}+(1-\lambda) x_{2}\right) \geqslant \lambda f\left(x_{1}\right)+(1-\lambda) f\left(x_{2}\right),$
则称 $f$ 为 $I$ 上的凹函数.
如果 (1)、(2) 中的不等式改为严格不等式,
则相应的函数称为严格凸函数和严格凹函数.
图 6-12 中的 (a) 和 (b) 分别是凸函数和凹函数的几何形状, 其中
$x=\lambda x_{1}+(1-$ ג)
$x_{2}, A=f\left(x_{1}\right), B=f\left(x_{2}\right), C=\lambda A+(1-\lambda) B$ .
容易证明: 若 $- f$ 为区间 $I$ 上的凸函数, 则 $f$ 为区间 $I$ 上的凹函数.
因此, 今后只需讨论凸函数的性质即可.
引理 $f$ 为 $I$ 上的凸函数的充要条件是: 对于 $I$ 上的任意三点
$x_{1}<x_{2}<x_{3}$ , 总有
$\frac{f\left(x_{2}\right)-f\left(x_{1}\right)}{x_{2}-x_{1}} \leqslant \frac{f\left(x_{3}\right)-f\left(x_{2}\right)}{x_{3}-x_{2}} .$
证必要性记 $\lambda=\frac{x_{3}-x_{2}}{x_{3}-x_{1}}$ , 则
$x_{2}=\lambda x_{1}+(1-\lambda) x_{3}$ . 由 $f$ 的凸性知道
$f\left(x_{2}\right)=f\left(\lambda x_{1}+(1-\lambda) x_{3}\right) \leqslant \lambda f\left(x_{1}\right)+(1-\lambda) f\left(x_{3}\right)$
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 {width=“186px”}
(a)
凸函数{width=“186px”}
(b) 凹函数
图 6-12
$=\frac{x_{3}-x_{2}}{x_{3}-x_{1}} f\left(x_{1}\right)+\frac{x_{2}-x_{1}}{x_{3}-x_{1}} f\left(x_{3}\right),$
从而有
$\begin{array}{c} \left(x_{3}-x_{1}\right) f\left(x_{2}\right) \leqslant\left(x_{3}-x_{2}\right) f\left(x_{1}\right)+\left(x_{2}-x_{1}\right) f\left(x_{3}\right), \\ \left(x_{3}-x_{2}\right) f\left(x_{2}\right)+\left(x_{2}-x_{1}\right) f\left(x_{2}\right) \leqslant\left(x_{3}-x_{2}\right) f\left(x_{1}\right)+\left(x_{2}-x_{1}\right) f\left(x_{3}\right) . \end{array}$

整理后即得 $(3)$ 式.
充分性如图 6-13 所示, 在 $I$ 上任取两点
$x_{1}, x_{3}\left(x_{1}<x_{3}\right)$ , 在 $\left[x_{1}, x_{3}\right]$
上任取一点 $x_{2}=\lambda x_{1}+(1-\lambda) x_{3}, \lambda \in(0,1)$ , 即
$\lambda=\frac{x_{3}-x_{2}}{x_{3}-x_{1}}$ . 由必要性的推导逆过程, 可推得
$f\left(\lambda x_{1}+(1-\lambda) x_{3}\right) \leqslant \lambda f\left(x_{1}\right)+(1-\lambda) f\left(x_{3}\right),$
故 $f$ 为 $I$ 上的凸函数.
同理可证, $f$ 为 $I$ 上的凸函数的充要条件是: 对于 $I$ 上任意三点
$x_{1}<x_{2}<x_{3}$ , 有
$\begin{aligned} \frac{f\left(x_{2}\right)-f\left(x_{1}\right)}{x_{2}-x_{1}} & \leqslant \frac{f\left(x_{3}\right)-f\left(x_{1}\right)}{x_{3}-x_{1}} \\ & \leqslant \frac{f\left(x_{3}\right)-f\left(x_{2}\right)}{x_{3}-x_{2}} . \end{aligned}$
外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 {width=“186px”}
图 6-13
注如果 $f (x)$ 为 $I$ 上的严格凸函数, 则不等式 (3) 和 (4) 中的
$\leqslant "$