什么是凹函数和凸函数?

日常生活中的“凹”和“凸”

在日常生活中,“凹”通常指一个物体或表面向内弯曲,而“凸”则指一个物体或表面向外突出。比如:

  • :我们一般形容为“凹下去”
    在这里插入图片描述

  • :我们一般形容为“凸出来”
    image.png

但数学上的“凹”与"凸"可能有所不同!!!

什么是凹函数和凸函数?

凹函数(Concave Function)

1. 样例
  • 想象一个碗倒过来的样子。当你把一个球放在这样的表面上时,球会滚向边缘,不会停留在中间。
  • 再想象一个桥拱的形状,上面平坦,下面是弯曲的。无论你在桥拱的哪个地方放一个球,球都会滚向两边。

image.png

image.png

2. 定义
  • 凹函数的定义是:对于函数 f ( x ) f(x) f(x) 上的任意两点 x 1 x_1 x1 x 2 x_2 x2,以及任意的 λ ∈ [ 0 , 1 ] \lambda \in [0, 1] λ[0,1],都有 f ( λ x 1 + ( 1 − λ ) x 2 ) ≥ λ f ( x 1 ) + ( 1 − λ ) f ( x 2 ) f(\lambda x_1 + (1-\lambda)x_2) \geq \lambda f(x_1) + (1-\lambda)f(x_2) f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2)
  • 也就是说,函数在两点之间的线段始终在函数的图像下方或正好位于图像上。

凹函数的例子 f ( x ) = − x 2 f(x) = -x^2 f(x)=x2。这是一个开口向下的抛物线。

3. 性质
  • 局部最大值:如果 f ( x ) f(x) f(x)在某个点 x ∗ x^* x达到局部最大值,则 x ∗ x^* x也是全局最大值点。
  • 导 数 : 如 果 f ( x ) f( x) f(x)是可导的,则 f ′ ( x ) f^{\prime}(x) f(x)是递减的(即 f ′ ′ ( x ) ≤ 0 f^{\prime\prime}(x)\leq0 f′′(x)0)。
  • 和:如果 f ( x ) f(x) f(x) g ( x ) g(x) g(x)都是凹函数,则 f ( x ) + g ( x ) f(x)+g(x) f(x)+g(x)也是凹函数。
  • 线 性 变 换 : 如 果 f ( x ) f( x) f(x)是凹函数,那么对于任何常数 c c c, c f ( x ) cf(x) cf(x)也是凹函数;如果 A A A是一个线性变换矩阵,则 f ( A x ) f(Ax) f(Ax)也是凹
    函数。

凸函数(Convex Function)

1. 样例
  • 想象一个碗的正常样子。当你把一个球放在这样的表面上时,球会滚向底部,停留在中间。

image.png

2. 定义
  • 凸函数的定义是:对于函数 g ( x ) g(x) g(x) 上的任意两点 x 1 x_1 x1 x 2 x_2 x2,以及任意的 λ ∈ [ 0 , 1 ] \lambda \in [0, 1] λ[0,1],都有 g ( λ x 1 + ( 1 − λ ) x 2 ) ≤ λ g ( x 1 ) + ( 1 − λ ) g ( x 2 ) g(\lambda x_1 + (1-\lambda)x_2) \leq \lambda g(x_1) + (1-\lambda)g(x_2) g(λx1+(1λ)x2)λg(x1)+(1λ)g(x2)

  • 也就是说,函数在两点之间的线段始终在函数的图像上方或正好位于图像上。

  • 凸函数的例子 g ( x ) = x 2 g(x) = x^2 g(x)=x2。这是一个开口向上的抛物线。

假设  g ( x ) = x 2 ,这是一个典型的凸函数。我们选择两个点  x 1 = 1  和  x 2 = 3 ,以及  λ = 0.5 。 ∙ λ x 1 + ( 1 − λ ) x 2 = 0.5 ⋅ 1 + 0.5 ⋅ 3 = 2 ∙ g ( λ x 1 + ( 1 − λ ) x 2 ) = g ( 2 ) = 2 2 = 4 ∙ λ g ( x 1 ) + ( 1 − λ ) g ( x 2 ) = 0.5 ⋅ 1 2 + 0.5 ⋅ 3 2 = 0.5 + 4.5 = 5 \begin{aligned}&\text{假设 }g(x)=x^2\text{,这是一个典型的凸函数。我们选择两个点 }x_1=1\text{ 和 }x_2=3\text{,以及 }\lambda=0.5\text{。}\\&\bullet \lambda x_1+(1-\lambda)x_2=0.5\cdot1+0.5\cdot3=2\\&\bullet g(\lambda x_1+(1-\lambda)x_2)=g(2)=2^2=4\\&\bullet \lambda g(x_1)+(1-\lambda)g(x_2)=0.5\cdot1^2+0.5\cdot3^2=0.5+4.5=5\end{aligned} 假设 g(x)=x2,这是一个典型的凸函数。我们选择两个点 x1=1  x2=3,以及 λ=0.5λx1+(1λ)x2=0.51+0.53=2g(λx1+(1λ)x2)=g(2)=22=4λg(x1)+(1λ)g(x2)=0.512+0.532=0.5+4.5=5
可以看到  g ( 2 ) = 4 ≤ 5 = 0.5 ⋅ 1 2 + 0.5 ⋅ 3 2 ,符合凸函数的定义。 \text{可以看到 }g(2)=4\leq5=0.5\cdot1^2+0.5\cdot3^2\text{,符合凸函数的定义。} 可以看到 g(2)=45=0.512+0.532,符合凸函数的定义。

3.性质
  • 局部最小值:如果 g ( x ) g(x) g(x)在某个点 x ∗ x^* x达到局部最小值,则 x ∗ x^* x也是全局最小值点
  • 导数 : 如 果 g( x)是可导的,则 g ′ ( x ) g^{\prime}(x) g(x)是递增的 (即 g ′ ′ ( x ) ≥ 0 ) g^{\prime\prime}(x)\geq0) g′′(x)0)
  • 和:如果 g ( x ) g(x) g(x) h ( x ) h(x) h(x)都是凸函数,则 g ( x ) + h ( x ) g(x)+h(x) g(x)+h(x)也是凸函数
  • 线性变换:如果 g ( x ) g(x) g(x)是凸函数,那么对于任何常数 c c c, c g ( x ) cg(x) cg(x)也是凸函数;如果 A A A是一个线性变换矩阵,则 g ( A x ) g(Ax) g(Ax)也是巴
    函数。

应用

  • 优化问题:在优化问题中,如果我们想找到一个函数的最小值,而这个函数是凸的,那么找到全局最小值就相对容易。相反,如果函数是凹的,我们需要找到的是最大值。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值