凸集的定义:
设集合 D⊂Rn D ⊂ R n ,若对于任意点 x,y∈D x , y ∈ D 及实数 α∈[0,1] α ∈ [ 0 , 1 ] ,都有 αx+(1−α)y∈D α x + ( 1 − α ) y ∈ D
则称集合 D D 为凸集。
由凸集的定义可以看出凸集的几何意义,对于非空集合
,连接 D D 中任意两点
的线段仍属于该集合,则该集合 D D 是凸集。
图1所示的图形是凸集,图2显示的图形是非凸集。
凸函数定义:
设函数 定义在凸集 D⊂Rn D ⊂ R n 上,若对于任意的 x,y∈D x , y ∈ D 及任意实数 α∈[0,1] α ∈ [ 0 , 1 ] ,都有 f[αx+(1−α)y]≤αf(x)+(1−α)f(y) f [ α x + ( 1 − α ) y ] ≤ α f ( x ) + ( 1 − α ) f ( y ) ,则称 f(x) f ( x ) 为凸集 D D 上的凸函数。
凸函数的充分必要条件:
(一阶条件)
设在凸集
上 f(x) f ( x ) 可微,则 f(x) f ( x ) 在 D D 上为凸函数的充分必要条件是对任意的
都有 f(y)≥f(x)+∇f(x)T(y−x) f ( y ) ≥ f ( x ) + ∇ f ( x ) T ( y − x )
证明:
必要性。 设 f(x) f ( x ) 是 D D 上的凸函数。任取
及 α∈[0,1] α ∈ [ 0 , 1 ] ,有
即
由泰勒公式有
代入上式得
上式两端取极限,令 α→0 α → 0 有