无约束问题与最优解
考虑如下最优化问题:
minx∈Rnf(x) min x ∈ R n f ( x )
无约束最优化问题的解由局部解和全局解两种,而实际上可行的往往只有局部解(或严格局部解)。如不加说明我们讨论的都是局部解。
局部解定义
设 x∗∈Rn x ∗ ∈ R n ,若存在 x∗ x ∗ 的 δ(δ>0) δ ( δ > 0 ) 邻域
Nδ(x∗)={
x|∥x−x∗∥<δ} N δ ( x ∗ ) = { x | ‖ x − x ∗ ‖ < δ }
使得
f(x)≥f(x∗),∀x∈Nδ(x∗) f ( x ) ≥ f ( x ∗ ) , ∀ x ∈ N δ ( x ∗ )
则称
x∗ x ∗
为
f(x) f ( x )
的局部解;若
f(x)>f(x∗),∀x∈Nδ(x∗) f ( x ) > f ( x ∗ ) , ∀ x ∈ N δ ( x ∗ )
则称
x∗ x ∗
为
f(x) f ( x )
的严格局部解。
最优性条件
一阶必要条件
设 f(x) f ( x ) 一阶连续可微,若 x∗ x ∗ 是一个局部解,则: ∇f(x∗)=0 ∇ f ( x ∗ ) = 0 。即 x∗ x ∗ 在任何方向上的方向导数均为零,该点所处的切平面是水平的。
二阶必要条件
设 f(x) f ( x ) 二阶连续可微,若 x∗ x ∗ 是一个局部解,则:
∇f(x∗)=0,∇2f(x∗) 为半正定 ∇ f ( x ∗ ) = 0 , ∇ 2 f ( x ∗ ) 为半正定
即在局部解
x∗ x ∗
处二阶方向导数非负。满足
∇f(x∗)=0 ∇ f ( x ∗ ) = 0
的点
x∗ x ∗
被称为函数
f f
的平稳点或
驻点,不是极小点也不是极大点的平稳点被称为函数的
鞍点。
二阶充分条件
设 二阶连续可微,且
∇f(x∗)=0,∇2f(x∗) 为正定 ∇ f ( x ∗ ) = 0 , ∇ 2 f ( x ∗ ) 为正定
则
x∗ x ∗
是无约束问题的一个严格局部解。
凸充分性定理
若 f:Rn→R f : R n → R 是凸函数,且 f(x) f ( x ) 的一阶连续可微的,则 x∗ x ∗ 是全局解得充分必要条件是 ∇f(x∗)=0 ∇ f ( x ∗ ) = 0 。
一维线性搜索
求解最优化问题的关键是构造一个点列 {
xk} { x k } 使其满足
limk→∞f(xk)=f(x∗)=minx∈Rf(x),limk→∞xk=x∗ lim k → ∞ f ( x k ) = f ( x ∗ ) = min x ∈ R f ( x ) , lim k → ∞ x k = x ∗
称
x∗ x ∗
为问题的解, 称
{
xk} { x k }
为
极小化点列,其构造方法一般采用逐步构造法:
xk+1=xk+αkdk,k=0,1,2,… x k + 1 = x k + α k d k , k = 0 , 1 , 2 , …
称
dk d k
为
搜索方向,
ak a k
为
步长。一维搜索问题即讨论如何确定步长的问题,下面简要介绍几种搜索方法,及其特色,但对算法本身不予详细介绍。
精确线性搜索
如果有 αk α k 使得
ϕ(αk)=minα≥0{
ϕ(α)=f(xk+αdk)} ϕ ( α k ) = min α ≥ 0 { ϕ ( α ) = f ( x k + α d k ) }
则称该搜索为精确线性搜索,称
αk α k
为最优步长。该方法有重要理论价值,但除了
f(x) f ( x )
是二次函数的特殊情况外,确定精确极小点是很困难的。
直接搜索法
首先介绍两个概念。
搜索区间
设 α∗ α ∗ 是 ϕ(α) ϕ ( α ) 的极小点,若存在区间 [a,b] [ a , b ] 使得 α∗∈[a.b] α ∗ ∈ [ a . b ] ,则称 [a,b] [ a , b ] 为 ϕ(α) ϕ ( α ) 的搜索区间。确定搜索区间可采用进退法。从一点出发确定函数值“高-低-高”的4点,一个方向不成功就退回来反方向寻找。
单峰函数
设函数 ϕ(α) ϕ ( α ) 在区间 [a,b] [ a , b ] 内存在极小点 α∗∈(a.b) α ∗ ∈ ( a . b ) ,如果对于任意 α1,α2 α 1 , α 2 满足:
- 当 α1<α2≤α∗ α 1 < α 2 ≤ α ∗ 时,有 ϕ(α1