凸函数和非凸函数以及Jensen不等式

第一部分:凸函数和非凸函数基本含义区分

(1)判断准则

方法1:对于所有x1, x2 ∈ I和任何t∈[0,1],都有f(t*x1 + (1-t)*x2) ≤ t*f(x1) + (1-t)*f(x2),则这个函数是凸函数;或者你想要简单点理解的话,我们找中点来快速理解:

 f ( ( x 1 + x 2 ) / 2 ) ≤ ( f ( x 1 ) + f ( x 2 ) ) / 2

方法2:图像含义

从几何角度看,凸函数的性质意味着其图像(即函数的图)位于任 意两点之间连接线段的下方

上面这个是凸函数的例子。

上面这个是非凸函数的例子。

方法3:求导方法

一元函数可以通过其二阶导数来判定是否为凸函数。如果函数的二阶导数非负,即f''(x) ≥ 0,那么该函数是凸的。若二阶导数严格大于0,则函数是严格凸的

第二部分:为什么要区分这两个函数,凸函数是有什么特殊性质吗

根据我们上述的定义:

y=x2是凸函数,y=-x2就不是凸函数。

这样做的主要目的是:凸函数能够保证找到全局最优解而非仅仅是局部最优解

下面找一个非凸函数的例子(存在局部最优解和全局最优解,这样模型在训练的过程中就非常容易陷入局部最优解中出不来,让问题复杂化,而凸函数只有一个全局最优解,没有局部最优解,就不会有陷入局部最优解这回事)

第三部分:凸函数和凹函数的最优化理论

(1)凸函数

凸函数保证损失函数有全局最小值,可以使用较为简单的优化算法

(2)凹函数

凹函数则需要使用更复杂的优化算法寻找最小值。

第四部分:凸约束和凸优化

(1)凸优化

使用凸优化算法来最小化凸函数的优化问题

(2)凸约束

在优化问题中,约束条件是凸函数

第五部分:Jensen不等式

(1)两点形式的 Jensen 不等式

凸函数是Jensen不等式的两点形式。

(2)期望形式的 Jensen 不等式

从上面这个图像中,我们就可以看到:E[f(X)]≥f(E[X])。其中E[f(X)]即 f(a) 和 f(b)之间的平均值

(3)积分形式的 Jensen 不等式

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

还不秃顶的计科生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值