项目github地址:bitcarmanlee easy-algorithm-interview-and-practice
欢迎大家star,留言,一起学习进步
1.优化问题的一般形式
最优化问题的一般数学形式为:
m
i
n
f
(
x
)
s
.
t
.
x
∈
X
min f(x) \\ s.t. \quad x \in X
minf(x)s.t.x∈X
其中,
x
∈
R
n
x \in R^n
x∈Rn为自变量,
f
(
x
)
f(x)
f(x)为目标函数,
x
⊂
R
n
x \subset R^n
x⊂Rn为约束集或者说可行域。
如果上面的优化问题中,
s
.
t
.
x
∈
X
s.t. x \in X
s.t.x∈X这部分约束内容没有,这个优化问题就叫做无约束优化。如果有,那这个优化问题叫有约束优化。如果约束内容里面包含的全是等式,那就叫做等式约束。如果包含不等式,则叫做不等式约束。
2.最优化方法的定义
一般优化问题的解法就叫做最优化方法。
实际中的问题一般都比较复杂,不太可能有直接的解析解。所以通常的解法都是采用迭代的方式求它的最优解。基本的步骤是:给定一个初始点
x
0
∈
R
n
x_0 \in R^n
x0∈Rn,按照某一个迭代规律产生一个点序列
x
k
x_k
xk,使得当
x
k
x_k
xk是有穷点序列时,最后的点就是最优化问题的最优解。而当
x
k
x_k
xk是无穷序列点时,它有极限点,而且该极限点就是最优化问题的最优解。
好的算法应该具备的典型特征为:迭代
x
k
x_k
xk能稳定地接近局部极小值点
x
∗
x_*
x∗的邻域,然后迅速收敛于
x
∗
x_*
x∗。当给定的某个收敛准则满足时,迭代终止。
如果用数学语言来描述,设
x
k
x_k
xk为第k次迭代点,
d
k
d_k
dk为第k次的搜索方向,
α
k
\alpha_k
αk为第k次步长因子,那么第k次迭代的表达式为:
x
k
+
1
=
x
k
+
α
k
d
k
x_{k + 1} = x_k + \alpha_kd_k
xk+1=xk+αkdk
接下来的工作就是调整 α k d k \alpha_kd_k αkdk这一项,不同的步长 α k \alpha_k αk与不同的搜索方向 d k d_k dk就分别构成了不同的最优化方法。
当然
α
k
\alpha_k
αk与搜索方向
d
k
d_k
dk需要满足一些条件。毕竟是求极小值,不能越迭代越大。比如下面是一些条件
∇
f
(
x
k
)
T
d
k
<
0
f
(
x
k
+
α
k
d
k
)
<
f
(
x
k
)
\nabla f(x_k) ^ T d_k < 0 \\ f(x_k + \alpha_kd_k) < f(x_k)
∇f(xk)Tdk<0f(xk+αkdk)<f(xk)
上面的式子说明搜索方向必须跟梯度方向的夹角大于90度。因为梯度的方向一般是使目标函数增大。如果不增大,说明目标函数已经到了极值。所以当搜索的方向与梯度方向大于90度的时候,就能保证是向目标函数值更小的方向搜索。
而下面那个式子的意义就很明确了,迭代的下一步的目标函数必须比上一步要小。
最后总结一下最优化方法的基本结构为:
先给点初始点
x
0
x_0
x0
1.按照一定规则,确实搜索方向
d
k
d_k
dk,构造目标函数f在
x
k
x_k
xk点处的下降方向为搜索方向。
2.确定步长因子
α
k
\alpha_k
αk,使目标函数值具有某种意义的下降。
3.令
x
k
+
1
=
x
k
+
α
k
d
k
x_{k + 1} = x_k + \alpha_k d_k
xk+1=xk+αkdk
若
x
k
+
1
x_k+1
xk+1满足某种终止条件,则停止迭代,得到近似最优解
x
k
+
1
x_{k + 1}
xk+1。否则重复上述步骤。
而能不能收敛到最优解是衡量最优化算法的有效性的一个重要方面。
3.收敛速度
除了能不能收敛,收敛速度也是最优化方法有效性的一个重要因素。
设有相邻的两个迭代点分别为
x
k
x_k
xk与
x
k
+
1
x_{k+1}
xk+1,假设最优解为
x
∗
x^*
x∗,弱存在实数q>0,且有:
lim
k
→
∞
∥
x
k
+
1
−
x
∗
∥
∥
x
k
−
x
∗
∥
=
q
\lim\limits_{k\rightarrow\infty}\frac{\|x_{k+1}-x^{*}\|}{\|x_{k}-x^{*}\|}=q
k→∞lim∥xk−x∗∥∥xk+1−x∗∥=q
如果0<q<1,表示算法线性收敛。
如果q=0,表示算法超线性收敛。
举个例子,有如下数列:
a
1
=
1
,
a
2
=
1
2
,
a
3
=
1
4
,
⋯
,
a
k
=
1
2
k
−
1
,
⋯
,
a
∞
=
0
a_1 = 1, a_2 = \frac{1}{2}, a_3 = \frac{1}{4}, \cdots, a_k = \frac{1}{2 ^ {k-1}}, \cdots, a_{\infty} = 0
a1=1,a2=21,a3=41,⋯,ak=2k−11,⋯,a∞=0
根据上面的计算公式,易知
q
=
1
2
q = \frac{1}{2}
q=21,因此该数列为线性收敛。
参考文献:
1.袁亚湘. 非线性优化计算方法