参考文献
赵晓智. 组合优化问题的尺度邻近点算法研究[D].中国民航大学,2020.DOI:10.27627/d.cnki.gzmhy.2020.000564.
预备知识
非光滑凸函数的组合优化问题可以表示为:
a
r
g
m
i
n
x
∈
H
Φ
(
x
)
:
=
a
r
g
m
i
n
x
∈
H
[
f
(
x
)
+
g
(
x
)
]
\underset{x\in H}{\rm{argmin}}\Phi (x):=\underset{x\in H}{\rm{argmin}}[f(x)+g(x)]
x∈HargminΦ(x):=x∈Hargmin[f(x)+g(x)]其中
H
H
H为Hilbert空间,
f
f
f,
g
g
g是Hilbert空间
H
H
H上的真下半连续凸函数,
f
f
f可微且具有连续的Lipschitz梯度。
Lipschitz梯度连续表示:
∥
∇
f
(
x
)
−
∇
f
(
y
)
∥
≤
L
∥
x
−
y
∥
,
∀
x
,
y
∈
H
\lVert\nabla f(x)-\nabla f(y)\rVert\le L\Vert x-y\rVert,\forall x,y\in H
∥∇f(x)−∇f(y)∥≤L∥x−y∥,∀x,y∈H
1.邻近梯度算法
x
n
+
1
=
p
r
o
x
γ
g
(
I
−
γ
∇
f
)
(
x
n
)
,
∀
n
≥
0
x_{n+1}=prox_{\gamma g}(I-\gamma\nabla f )(x_n),\forall n\ge0
xn+1=proxγg(I−γ∇f)(xn),∀n≥0其中步长
γ
\gamma
γ满足
0
<
γ
<
2
/
L
0<\gamma<2/L
0<γ<2/L,
p
r
o
x
γ
g
prox_{\gamma g}
proxγg表示
γ
g
\gamma g
γg的邻近算子,邻近算子的定义为:
p
r
o
x
g
(
x
)
=
a
r
g
m
i
n
y
∈
H
g
(
y
)
+
1
/
2
∥
y
−
x
∥
2
,
x
∈
H
prox_g(x)=\underset{y\in H}{\rm{argmin}} g(y)+1/2\lVert y-x \rVert^2,x\in H
proxg(x)=y∈Hargming(y)+1/2∥y−x∥2,x∈H
p
r
o
x
γ
g
(
x
)
=
a
r
g
m
i
n
y
∈
H
g
(
y
)
+
1
2
γ
∥
y
−
x
∥
2
,
x
∈
H
prox_{\gamma g}(x)=\underset{y\in H}{\rm{argmin}} g(y)+\frac{1}{2\gamma }\lVert y-x \rVert^2,x\in H
proxγg(x)=y∈Hargming(y)+2γ1∥y−x∥2,x∈H 若原问题的解集非空,则该方法生成的迭代序列若收敛于原问题的解(证明见参考文献中[16]定理25.8);文献[17]提出变步长邻近梯度算法
x
n
+
1
=
p
r
o
x
γ
n
g
(
I
−
γ
n
∇
f
)
(
x
n
)
,
x_{n+1}=prox_{\gamma_n g}(I-\gamma_n\nabla f )(x_n),
xn+1=proxγng(I−γn∇f)(xn),生成的序列也弱收敛于原问题的解。
带扰动的邻近尺度梯度算法[23]:
x
n
+
1
=
p
r
o
x
λ
n
g
(
I
−
λ
n
D
∇
f
+
e
)
(
x
n
)
,
x_{n+1}=prox_{\lambda_n g}(I-\lambda_nD\nabla f +e)(x_n),
xn+1=proxλng(I−λnD∇f+e)(xn), 压缩算子和邻近梯度算子的凸组合[24]:
x
n
+
1
=
t
n
h
(
x
n
)
+
(
1
−
t
n
)
p
r
o
x
α
n
g
(
I
−
α
n
D
∇
f
+
e
)
(
x
n
)
.
x_{n+1}=t_nh(x_n)+(1-t_n)prox_{\alpha_n g}(I-\alpha_nD\nabla f +e)(x_n).
xn+1=tnh(xn)+(1−tn)proxαng(I−αnD∇f+e)(xn).2.superiorization方法
在原始优化算法的基础上通过定义成本函数的方法用于解决非线性约束的优化问题,构造前提是原始优化算法具有有界扰动恢复性,使用superiorization方法改造后的算法运行时间段内、迭代步数少。[25-43]
有界扰动恢复性:设
H
H
H是实Hilbert空间,
Φ
\Phi
Φ是给定问题,
A
Φ
:
H
→
H
A_{\Phi}:H\to H
AΦ:H→H是一个算法算子,我们称算子具有有界扰动恢复性,当:若任意给定
x
0
∈
H
x_0\in H
x0∈H,由
x
n
+
1
=
A
Φ
x
n
x_{n+1}=A_{\Phi}x_n
xn+1=AΦxn生成的序列
{
x
n
}
n
=
0
∞
\{ x_n \}^{\infty}_{n=0}
{xn}n=0∞收敛到问题
Φ
\Phi
Φ的解,那么任意给定给定
y
0
∈
H
y_0\in H
y0∈H,有界序列
{
v
n
}
n
=
0
∞
\{ v_n \}^{\infty}_{n=0}
{vn}n=0∞,可求和非负实数列
{
β
n
}
n
=
0
∞
\{\beta_n \}^{\infty}_{n=0}
{βn}n=0∞,则由
y
n
+
1
=
A
Φ
(
y
n
+
β
n
v
n
)
y_{n+1}=A_{\Phi}(y_n+\beta_nv_n)
yn+1=AΦ(yn+βnvn)生成的序列
{
y
n
}
n
=
0
∞
\{y_n \}^{\infty}_{n=0}
{yn}n=0∞也收敛到问题
Φ
\Phi
Φ的解
本文工作
介绍了多参数邻近尺度梯度算法和超松弛邻近尺度梯度算法,证明了算法的强收敛性和有界扰动恢复性,在此基础上给出superiorization算法,并设计了数值算例。
多参数邻近尺度梯度算法
v
n
+
1
=
t
n
h
(
v
n
)
+
γ
n
v
n
+
λ
n
p
r
o
x
α
n
g
(
I
−
α
n
D
∇
f
)
(
v
n
)
v_{n+1}=t_nh(v_n)+\gamma_nv_n+\lambda_nprox_{\alpha_ng}(I-\alpha_nD\nabla f)(v_n)
vn+1=tnh(vn)+γnvn+λnproxαng(I−αnD∇f)(vn)其中
t
n
,
γ
n
,
λ
n
⊂
[
0
,
1
]
{t_n},{\gamma_n},{\lambda_n}\subset[0,1]
tn,γn,λn⊂[0,1]、
0
<
i
n
f
n
γ
n
0<\underset{n}{inf}\gamma_n
0<ninfγn且
t
n
+
γ
n
+
λ
n
=
1
{t_n}+{\gamma_n}+{\lambda_n}=1
tn+γn+λn=1,映射
h
:
H
→
H
h:H\to H
h:H→H为
ρ
\rho
ρ压缩映射,
ρ
∈
[
0
,
1
)
\rho\in[0,1)
ρ∈[0,1)且
∑
n
=
0
∞
∥
θ
(
v
n
)
∥
:
=
∑
n
=
0
∞
∥
∇
f
(
v
n
)
−
D
(
v
n
)
∇
f
(
v
n
)
∥
<
∞
\sum_{n=0}^\infty{\lVert\theta(v_n)\rVert}:=\sum_{n=0}^\infty{\lVert\nabla f(v_n)-D(v_n)\nabla f(v_n)\rVert}<\infty
n=0∑∞∥θ(vn)∥:=n=0∑∞∥∇f(vn)−D(vn)∇f(vn)∥<∞
证明思路:1、先证明上述算法生成的
{
v
n
}
\{v_n\}
{vn}强收敛于问题的解,并求出该解:先证
{
v
n
}
\{v_n\}
{vn}有界,再证存在
{
v
n
}
\{v_n\}
{vn}的子列
{
v
n
}
\{v_n\}
{vn}弱极限点集包含于原问题的解集,最后证明
{
v
n
}
\{v_n\}
{vn}收敛到问题解集中的
z
z
z,这里
z
z
z是满足
⟨
(
I
−
h
)
z
,
v
−
z
⟩
≥
0
,
v
∈
S
\lang (I-h)z,v-z\rang\ge0,v\in S
⟨(I−h)z,v−z⟩≥0,v∈S的唯一解。2、再证该算法具有有界扰动恢复性质,即
x
n
+
1
=
t
n
h
(
x
n
+
β
n
y
n
)
+
γ
n
(
x
n
+
β
n
y
n
)
+
λ
n
p
r
o
x
α
n
g
(
I
−
α
n
D
∇
f
)
(
x
n
+
β
n
y
n
)
x_{n+1}=t_nh(x_n+\beta_ny_n)+\gamma_n(x_n+\beta_ny_n)+\lambda_nprox_{\alpha_ng}(I-\alpha_nD\nabla f)(x_n+\beta_ny_n)
xn+1=tnh(xn+βnyn)+γn(xn+βnyn)+λnproxαng(I−αnD∇f)(xn+βnyn)(这里
{
y
n
}
n
=
0
∞
\{y_n \}^{\infty}_{n=0}
{yn}n=0∞是有界序列)强收敛于问题解集中的点。3、写出该算法的superiorization算法。
通过数值算例证明了多参数邻近尺度梯度算法的superiorization算法运行效果最优。
超松弛邻近尺度梯度算法
v n + 1 = t n h ( v n ) + γ n v n + λ n p r o x α n g ( I − α n D ∇ f ) ( v n ) + e n v_{n+1}=t_nh(v_n)+\gamma_nv_n+\lambda_nprox_{\alpha_ng}(I-\alpha_nD\nabla f)(v_n)+e_n vn+1=tnh(vn)+γnvn+λnproxαng(I−αnD∇f)(vn)+en 此为带有外扰动的超松弛邻近尺度梯度算法,带有内扰动的超松弛邻近尺度梯度算法可以转化为外扰动超松弛邻近尺度梯度算法。证明类似上一命题,略。