什么是凹函数和凸函数？

最新推荐文章于 2024-12-30 16:11:21 发布

qq_42859625

最新推荐文章于 2024-12-30 16:11:21 发布

阅读量2.6k

点赞数 31

分类专栏：深度学习文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/qq_42859625/article/details/141964813

版权

深度学习专栏收录该内容

6 篇文章

订阅专栏

日常生活中的“凹”和“凸”

在日常生活中，“凹”通常指一个物体或表面向内弯曲，而“凸”则指一个物体或表面向外突出。比如：

凹：我们一般形容为“凹下去”
凸：我们一般形容为“凸出来”

但数学上的“凹”与"凸"可能有所不同！！！

什么是凹函数和凸函数？

凹函数（Concave Function）

1. 样例

想象一个碗倒过来的样子。当你把一个球放在这样的表面上时，球会滚向边缘，不会停留在中间。
再想象一个桥拱的形状，上面平坦，下面是弯曲的。无论你在桥拱的哪个地方放一个球，球都会滚向两边。

2. 定义

凹函数的定义是：对于函数 $f (x)$ 上的任意两点 $x_1$ 和 $x_2$ ，以及任意的 $\lambda \in [0, 1]$ ，都有 $f(\lambda x_1 + (1-\lambda)x_2) \geq \lambda f(x_1) + (1-\lambda)f(x_2)$ 。
也就是说，函数在两点之间的线段始终在函数的图像下方或正好位于图像上。

凹函数的例子： $f(x) = -x^2$ 。这是一个开口向下的抛物线。

3. 性质

局部最大值：如果 $f (x)$ 在某个点 $x^*$ 达到局部最大值，则 $x^*$ 也是全局最大值点。
导数 : 如果 $f (x)$ 是可导的，则 $f^{\prime}(x)$ 是递减的(即 $f^{\prime\prime}(x)\leq0$ )。
和：如果 $f (x)$ 和 $g (x)$ 都是凹函数，则 $f (x) + g (x)$ 也是凹函数。
线性变换 : 如果 $f (x)$ 是凹函数，那么对于任何常数 $c$ , $c f (x)$ 也是凹函数；如果 $A$ 是一个线性变换矩阵，则 $f (A x)$ 也是凹
函数。

凸函数（Convex Function）

1. 样例

想象一个碗的正常样子。当你把一个球放在这样的表面上时，球会滚向底部，停留在中间。

2. 定义

凸函数的定义是：对于函数 $g (x)$ 上的任意两点 $x_1$ 和 $x_2$ ，以及任意的 $\lambda \in [0, 1]$ ，都有 $g(\lambda x_1 + (1-\lambda)x_2) \leq \lambda g(x_1) + (1-\lambda)g(x_2)$ 。
也就是说，函数在两点之间的线段始终在函数的图像上方或正好位于图像上。
凸函数的例子： $g(x) = x^2$ 。这是一个开口向上的抛物线。

$\begin{aligned}&\text{假设 }g(x)=x^2\text{,这是一个典型的凸函数。我们选择两个点 }x_1=1\text{ 和 }x_2=3\text{,以及 }\lambda=0.5\text{。}\\&\bullet \lambda x_1+(1-\lambda)x_2=0.5\cdot1+0.5\cdot3=2\\&\bullet g(\lambda x_1+(1-\lambda)x_2)=g(2)=2^2=4\\&\bullet \lambda g(x_1)+(1-\lambda)g(x_2)=0.5\cdot1^2+0.5\cdot3^2=0.5+4.5=5\end{aligned}$
$\text{可以看到 }g(2)=4\leq5=0.5\cdot1^2+0.5\cdot3^2\text{,符合凸函数的定义。}$

3.性质

局部最小值：如果 $g (x)$ 在某个点 $x^*$ 达到局部最小值，则 $x^*$ 也是全局最小值点
导数 : 如果 g( x)是可导的，则 $g^{\prime}(x)$ 是递增的 (即 $g^{\prime\prime}(x)\geq0)$
和：如果 $g (x)$ 和 $h (x)$ 都是凸函数，则 $g (x) + h (x)$ 也是凸函数
线性变换：如果 $g (x)$ 是凸函数，那么对于任何常数 $c$ , $c g (x)$ 也是凸函数；如果 $A$ 是一个线性变换矩阵，则 $g (A x)$ 也是巴
函数。