多目标进化优化的Tchebycheff分解方法

On Tchebycheff Decomposition Approaches for 
Multiobjective Evolutionary Optimization

Digital Object Identifier 10.1109/TEVC.2017.2704118


摘要:

Tchebycheff分解是一种极广泛使用的分解方法,其能将一个多目标优化问题转化为一组标量优化子问题。然而,在Tchebycheff分解中,子目标函数的几何属性还没有被详尽地研究。本文通过对方向向量进行lplp-范式约束提出了一种Tchebycheff分解方法,其中,子目标函数具有明确的几何属性。尤其,对方向向量进行l2l2-范式约束的Tchebycheff分解作为例子被用于说明其优越性。同时,一个新的一元R2R2指标被引入来近似超体积度量(Hyper-volume metric)及证明提出的Tchebycheff分解的有效性。最终,一个基于使用l2l2-范式约束的Tchebycheff分解的多目标优化算法和一个新的种群更新策略被提出来解决多目标优化问题。在基准测试集及现实世界的多目标优化问题上的实验结果表明,相比其他主流多目标优化算法,提出的算法能够获得高质量的解。


索引词

—Tchebycheff分解,基于分解的多目标优化算法,种群更新策略,最大适应值改善,R2R2指标


I. 引言

一个多目标问题(Multi-objective problem,MOP)【1,2】可以用公式描述为: 
minF(x)=(f1(x),f2(x),...,fm(x))minF(x)=(f1(x),f2(x),...,fm(x))(1) 
subjectto:x∈Ωsubjectto:x∈Ω 
其中,xx为一个决策变量向量,ΩΩ为决策空间,F(x):Ω→RmF(x):Ω→Rm为mm个目标函数的一个mm-维向量。

令xaxa和xbxb表示两个决策向量,xaxa支配xbxb(表示为xa≺xbxa≺xb),当且仅当∀i∈{1,...,m},fi(xa)≤fi(xb)∀i∈{1,...,m},fi(xa)≤fi(xb)及F(xa)≠F(xb)F(xa)≠F(xb)。一个解x∗∈Ωx∗∈Ω如果不被其他任何解支配,则被称为是Pareto最优的。所有的Pareto最优解组成了Pareto最优集(Pareto optimal set,PS),即,PS={x∗|∄x∈Ω,x≺x∗}PS={x∗|∄x∈Ω,x≺x∗}。相应的最优目标向量集称为Pareto最优前沿(Pareto optimal front,PF),即,PF={F(x)|x∈PS}PF={F(x)|x∈PS}。

基于分解的多目标优化算法(MOEA/D)已被认为是一种非常有效的估计PFPF的方法【3-14】。分解方法是MOEA/D的关键组成。Tchebycheff分解是一种最为广泛使用的分解方法。然而,使用均匀权重向量的Tchebycheff分解所获得的解通常并不是均匀分布的【5-9】。广义分解【5-7】和改进的Tchebycheff分解【9,10】被提出以解决此问题,但在这些Tchebycheff分解方法中的子目标函数的几何属性还没有被详尽地研究。

本文提出一种对方向向量进行lplp-范式约束的Tchebycheff分解方法(pp-Tch),其中,子目标函数有明确的几何属性。对pp-Tch和其他Tchebycheff分解方法的关系进行了研究。不同的pp值对MOEA/D的子问题施加了不同的竞争压力。使用l2l2-范式约束(2-Tch)的Tchebycheff分解被作为例子来说明所提出的分解方法的优点。指标R2tch2R22tch,一种基于2-Tch的R2R2指标【15】的变体,也被引入以近似超体积度量来证实提出的Tchebycheff分解的有效性。

MOEA/D框架中使用了2-Tch及一个新的种群更新策略。在大多数的MOEA/D变体(比如,【4,16-18】)中,进化种群的更新是基于一种局部随机策略。在【19】中,一种基于最小适应值的全局策略被提出。然而,上述策略都是被设计用来优化某些子问题的性能,而不是所有子问题。为解决此问题,本文引入了一种基于最大适应值改善的全局种群更新策略来优化所有子问题的总体性能。最终的算法,MOEA/D-2TCHMFI(基于2-Tch和最大适应值提升的种群更新策略的MOEA/D),在多种基准测试集和现实世界的多目标优化问题上进行了测试。实验结果表明,相比其他多目标优化算法,MOEA/D-2TCHMFI能够得到高质量的解。

在本文的其余部分,第II节回顾了两种密切相关的Tchebycheff分解方法。所提出的对方向向量进行lplp-范式约束的Tchebycheff分解方法和分解的广义形式在第III节引入。第IV节提出了基于最大适应值改善的种群更新策略。最终的MOEA/D-2TCHMFI算法在第V节被描述。第VI节定义了提出的一元指标R2tch2R22tch。第VII节展示了MOEA/D-2TCHMFI和其他先进多目标优化算法的比较结果。最后,第VIII节对本工作进行了总结。


II. 两种关系密切的Tchebycheff分解方法

在本节,我们回顾了两种关系密切的Tchebycheff分解方法,即,传统Tchebycheff分解【20】和改进Tchebycheff分解【10】。在这两种Tchebycheff分解方法中的子问题目标函数的几何属性被详细研究。


A. 传统Tchebycheff分解

传统Tchebycheff分解将一个MOP分解成一组标量优化子问题,每一个的定义如下: 
minx∈Ωgtch(F(x)|w,z∗)=max1≤i≤m{wi(fi(x)−z∗)}minx∈Ωgtch(F(x)|w,z∗)=max1≤i≤m{wi(fi(x)−z∗)}(2) 
其中,wi=(w1,...,wm)wi=(w1,...,wm)满足∑mi=1wi=1∑i=1mwi=1 及wi≥0wi≥0,为一个子问题的权重向量,z∗=(z∗1,z∗2,...,z∗m)z∗=(z1∗,z2∗,...,zm∗)满足z∗i<min{fi(x)|x∈Ω}zi∗<min{fi(x)|x∈Ω},为一理想目标向量。

传统Tchebycheff分解中的子问题目标函数的几何属性还没有被研究。据我们所知,本工作首次研究了Tchebycheff分解中的子问题目标函数的几何属性。

命题 2.1:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)为(1)的一个理想目标向量,w=(w1,...,wm)w=(w1,...,wm)为正权重向量。若一个给定的目标向量F(x)=(f1(X),...,Fm(x))F(x)=(f1(X),...,Fm(x))位于直线 
L1:w1(f1(x)−z∗1)=...=wm(fm(x)−z∗m)L1:w1(f1(x)−z1∗)=...=wm(fm(x)−zm∗) 
如图1(a)所示。那么, 
gtch(F(x)|w,z∗)=wT(F(x)−z∗)mgtch(F(x)|w,z∗)=wT(F(x)−z∗)m(3)

证明 由于F(x)F(x)位于直线L1L1,我们得到 
gtch(F(x)|w,z∗)===(2)max1≤i≤m{wi(fi(x)−z∗i)}===L1w1(f1(x)−z∗1)=...=wm(fm(x)−z∗m)=∑mi=1wi(fi(x)−z∗i)m=wT(F(x)−z∗)m      ■gtch(F(x)|w,z∗)===(2)max1≤i≤m{wi(fi(x)−zi∗)}===L1w1(f1(x)−z1∗)=...=wm(fm(x)−zm∗)=∑i=1mwi(fi(x)−zi∗)m=wT(F(x)−z∗)m      ◼ 
公式(3)用于说明gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的几何属性,而不是找到gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的最优解,即,minx∈Ωgtch(F(x)|w,z∗)minx∈Ωgtch(F(x)|w,z∗)。以F(x)=(1/2,1/4)F(x)=(1/2,1/4),z∗=(0,0)z∗=(0,0)及w=(1/3,2/3)w=(1/3,2/3)为例,如图1(a)所示,我们可以使用等式(3)来解释子问题适应值gtch(F(x)|w,z∗)gtch(F(x)|w,z∗),ww,与F(x)−z∗F(x)−z∗的关系。式(3)(即wT(F(x)−z∗)/mwT(F(x)−z∗)/m)给出了l1l1-范式的加权形式,为gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的对偶式【21,pp. 637】。 
F(x)F(x)不位于L1L1的情形可以如下命题描述。

命题 2.2:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)为一个(1)的理想目标向量,w=(w1,...,wm)w=(w1,...,wm)为一个正的权重向量。给定一个目标向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x)),F^(x)=(f^1(x),...,f^m(x))F^(x)=(f^1(x),...,f^m(x))可以如下构建:1)F^(x)F^(x)与F(x)F(x)有相同的子问题适应值,即,gtch(F(x)|w,z∗)=gtch(F^(x)|w,z∗)gtch(F(x)|w,z∗)=gtch(F^(x)|w,z∗);2)F^(x)F^(x)位于图1(d)所示的直线L1L1。那么,如下等式可以满足: 
gtch(F(x)|w,z∗)=wT(F^(x)−z∗)mgtch(F(x)|w,z∗)=wT(F^(x)−z∗)m(4)

证明 由F^(x)F^(x)的构建,我们得到 
gtch(F(x)|w,z∗)===1)=======2)F^(x) is in L1wT(F^(x)−z∗)m      ■gtch(F(x)|w,z∗)===1)=======2)F^(x) is in L1wT(F^(x)−z∗)m      ◼

备注 给定目标向量F(x)F(x),F^(x)=(f^1(x),...,f^m(x))F^(x)=(f^1(x),...,f^m(x))实际上是gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的等值线与L1L1在目标空间的交点,如图1(d)所示,并且f^i(x)=z∗i+gtch(F(x)|w,z∗)wi,i=1,...,mf^i(x)=zi∗+gtch(F(x)|w,z∗)wi,i=1,...,m 
由于这样的事实:

gtch(F(x)|w,z∗)===1)gtch(F^(x)|w,z∗)===2)w1(f^1(x)−z∗1)=...=wm(f^m(x)−z∗m)      ■gtch(F(x)|w,z∗)===1)gtch(F^(x)|w,z∗)===2)w1(f^1(x)−z1∗)=...=wm(f^m(x)−zm∗)      ◼ 
以F(x)=(1,1)F(x)=(1,1),z∗=(0,0)z∗=(0,0),及w=(1/3,2/3)w=(1/3,2/3)为例,我们能得到: 
gtch(F(x)|w,z∗)=max{13(1−0),23(1−0)}=2/3gtch(F(x)|w,z∗)=max{13(1−0),23(1−0)}=2/3, 
f^1(x)=z∗1+gtch(F(x)|w,z∗)w1=0+2/31/3=2f^1(x)=z1∗+gtch(F(x)|w,z∗)w1=0+2/31/3=2, 
f^2(x)=z∗2+gtch(F(x)|w,z∗)w2=0+2/32/3=1f^2(x)=z2∗+gtch(F(x)|w,z∗)w2=0+2/32/3=1.


B. 改进Tchebycheff分解

为处理最优解与相应的子问题权重向量之间的非线性关系【5-8,22-24】,研究【10】提出了改进Tchebycheff分解。并没有与(2)中的wiwi相乘,改进Tchebycheff分解通过用fi(x)−z∗ifi(x)−zi∗除以wiwi来构建子问题,如下:

minx∈Ωgmtch(F(x)|w,z∗)=max1≤i≤m{fi(x)−z∗iwi}minx∈Ωgmtch(F(x)|w,z∗)=max1≤i≤m{fi(x)−zi∗wi}(5)

对改进Tchebycheff分解中的一个子问题目标函数的几何属性的研究如下。

命题 2.3:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)为(1)中的一理想目标向量,w=(w1,...,wm)w=(w1,...,wm)为一正的权重向量。若一给定的目标向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x))位于直线 
L2: f1(x)−z∗1w1=...=fm(x)−z∗mwmL2: f1(x)−z1∗w1=...=fm(x)−zm∗wm 
如图1(b)所示。那么, 
gmtch(F(x)|w,z∗)=∥F(x)−z∗∥1gmtch(F(x)|w,z∗)=‖F(x)−z∗‖1(6)

证明 由于F(x)F(x)在L2L2上,我们可以得出, 
gmtch(F(x)|w,z∗)===(5)max1≤i≤m{fi(x)−z∗iwi}gmtch(F(x)|w,z∗)===(5)max1≤i≤m{fi(x)−zi∗wi} 
===L2f1(x)−z∗1w1=...=fm(x)−z∗mwm===L2f1(x)−z1∗w1=...=fm(x)−zm∗wm 
=∑mi=1(fi(x)−z∗i)∑mi=1wi=∥F(x)−z∗∥1      ■=∑i=1m(fi(x)−zi∗)∑i=1mwi=‖F(x)−z∗‖1      ◼ 
以F(x)=(1/4,2/4)F(x)=(1/4,2/4),z∗=(0,0)z∗=(0,0),及w=(1/3,2/3)w=(1/3,2/3)为例,式(6)可以如下计算:

gmtch(F(x)|w,z∗)=max{f1(x)−z∗1w1,f2(x)−z∗2w2}gmtch(F(x)|w,z∗)=max{f1(x)−z1∗w1,f2(x)−z2∗w2} 
=max{1/4−01/3,2/4−02/3}=34=∥F(x)−z∗∥1=max{1/4−01/3,2/4−02/3}=34=‖F(x)−z∗‖1 
当F(x)F(x)不在L2L2时,以下命题描述了gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)的几何属性。

命题 2.4:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)为(1)中的一理想目标向量,w=(w1,...,wm)w=(w1,...,wm)为一正的权重向量。给定一目标向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x)),可以由满足以下两个约束生成F~(x)=(f~1(x),...,f~m(x))F~(x)=(f~1(x),...,f~m(x)):1)f~(x)f~(x)和F(x)F(x)位于同一等值线上,即,gmtch(F(x)|w,z∗)=gmtch(F~(x)|w,z∗)gmtch(F(x)|w,z∗)=gmtch(F~(x)|w,z∗);及2)f~(x)f~(x)位于直线L2L2上,如图1(e)所示。那么, 
gmtch(F(x)|w,z∗)=∥∥F~(x)−z∗∥∥1gmtch(F(x)|w,z∗)=‖F~(x)−z∗‖1 (7)

证明 据F~(x)F~(x)的情况,我们得到 
gmtch(F(x)|w,z∗)====1)gmtch(F~(x)|w,z∗)gmtch(F(x)|w,z∗)====1)gmtch(F~(x)|w,z∗) 
====================2) F~(x) is in L2 {Proposition 2.3}∥∥F~(x)−z∗∥∥1      ■====================2) F~(x) is in L2 {Proposition 2.3}‖F~(x)−z∗‖1      ◼

备注 在几何中,gmtch(F(x)|w,z∗)gmtch(F(x)|w,z∗)等同于F~(x)−z∗F~(x)−z∗的l1l1-范式,如图1(e)所示。F~(x)F~(x)为直线L2L2与gmtch(F(x)|w,z∗)gmtch(F(x)|w,z∗)的等值线的交点,如图1(e)所示。

F~(x)=(f~1(x),...,f~m(x))=z∗+gmtch(F(x)|w,z∗)⋅wF~(x)=(f~1(x),...,f~m(x))=z∗+gmtch(F(x)|w,z∗)⋅w 
由于 
gmtch(F(x)|w,z∗)===1)gmtch(F~(x)|w,z∗)gmtch(F(x)|w,z∗)===1)gmtch(F~(x)|w,z∗) 
=====2) L2f~1(x)−z∗1w1=...=f~m(x)−z∗mwm      ■=====2) L2f~1(x)−z1∗w1=...=f~m(x)−zm∗wm      ◼

例如,给定F(x)=(0.5,2)F(x)=(0.5,2),z∗=(0,0)z∗=(0,0),及w=(1/3.2/3)w=(1/3.2/3),我们可以计算 
gmtch(F(x)|w,z∗)=max{0.5−01/3,2−02/3}=3,gmtch(F(x)|w,z∗)=max{0.5−01/3,2−02/3}=3, 
f~1(x)=z∗1+gmtch(F(x)|w,z∗)⋅w1=0+3⋅1/3=1,f~1(x)=z1∗+gmtch(F(x)|w,z∗)⋅w1=0+3⋅1/3=1, 
f~2(x)=z∗2+gmtch(F(x)|w,z∗)⋅w2=0+3⋅2/3=2.f~2(x)=z2∗+gmtch(F(x)|w,z∗)⋅w2=0+3⋅2/3=2.


III. 提出的对方向向量进行lplp-范式约束的Tchebycheff分解

通过对改进Tchebycheff分解进行拓展,本文提出一种新的对方向向量进行lplp-范式约束的Tchebycheff分解方法,简称为pp-Tch。在pp-Tch中,每个子问题的构建基于一个满足∥λ∥p=1‖λ‖p=1的方向向量λλ,而不是改进Tchebycheff分解中使用的满足∥w∥1=∑mi=1wi=1‖w‖1=∑i=1mwi=1的权重向量ww,即,

minx∈Ωgptch(F(x)|λ,z∗)=max1≤i≤m{fi(x)−z∗iλi}minx∈Ωgptch(F(x)|λ,z∗)=max1≤i≤m{fi(x)−zi∗λi}(8) 
其中,λ=(λ1,...,λm)λ=(λ1,...,λm)满足∥λ∥p=1‖λ‖p=1及λ1,...,λm>0λ1,...,λm>0。注意,改进Tchebycheff分解(5)是p=1p=1时的pp-Tch的一种特殊形式,近似于Chebyshev近似问题【21,pp. 293】,是pp-Tch(8)的一个同等问题,可用公式描述为:

minx∈Ω   tminx∈Ω   t 
s.t.     fi(x)−z∗iλi≤t,i=1,...,ms.t.     fi(x)−zi∗λi≤t,i=1,...,m


A. pp-Tch中的子问题目标函数的几何属性

命题 3.1:令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)为(1)的一个理想目标向量,方向向量λλ为一正向量且满足∥λ∥p=1‖λ‖p=1。若一给定的目标向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x))位于直线 
L3:f1(x)−z∗1λ1=...=fm(x)−z∗mλm.L3:f1(x)−z1∗λ1=...=fm(x)−zm∗λm. 
那么 
gptch(F(x)|λ,z∗)=∥F(x)−z∗∥pgptch(F(x)|λ,z∗)=‖F(x)−z∗‖p(9)

证明 由于fi(x)−z∗i≥0fi(x)−zi∗≥0并且对于∀i∈{1,2,...,m}∀i∈{1,2,...,m}有λi>0λi>0, 
k(x)≜gptch(F(x)|λ,z∗)===(8)max1≤i≤m{fi(x)−z∗iλi}k(x)≜gptch(F(x)|λ,z∗)===(8)max1≤i≤m{fi(x)−zi∗λi} 
===L3f1(x)−z∗1λ1=...=fm(x)−z∗mλm≥0===L3f1(x)−z1∗λ1=...=fm(x)−zm∗λm≥0(10)

由于对于i=1,...,mi=1,...,m有fi(x)−z∗i=λi⋅k(x)fi(x)−zi∗=λi⋅k(x),且F(x)−z∗=k(x)⋅λF(x)−z∗=k(x)⋅λ,我们有

gptch(F(x)|λ,z∗)=k(x)=====∥λ∥p=1k(x)⋅∥λ∥p========k(x)≥0  (10)gptch(F(x)|λ,z∗)=k(x)=====‖λ‖p=1k(x)⋅‖λ‖p========k(x)≥0  (10) 
∥k(x)⋅λ∥p===========k(x)⋅=F(x)−z∗∥F(x)−z∗∥p‖k(x)⋅λ‖p===========k(x)⋅=F(x)−z∗‖F(x)−z∗‖p(11) 
               ■               ◼ 
以p=2p=2,F(x)=(1,2)F(x)=(1,2),λ=(1/5–√,2/5–√)λ=(1/5,2/5),及z∗=(0,0)z∗=(0,0)为例,我们能得到 
g2tch(F(x)|λ,z∗)=max{f1(x)−z∗1λ1,f2(x)−z∗2λ2}g2tch(F(x)|λ,z∗)=max{f1(x)−z1∗λ1,f2(x)−z2∗λ2} 
=max{1−01/5–√,2−02/5–√}=5–√=∥F(x)−z∗∥2=max{1−01/5,2−02/5}=5=‖F(x)−z∗‖2

命题3.1描述的情形在p=2p=2时可以用图1(c)说明。如图所示,gptch(F(x)|λ,z∗)gptch(F(x)|λ,z∗)为p=2p=2时的z∗z∗到F(x)F(x)的欧氏距离。F(x)F(x)不位于L3L3的情形可以用如下命题描述。 
命题 3.2:,令z∗=(z∗1,...,z∗m)z∗=(z1∗,...,zm∗)为(1)的一理想目标向量,方向向量λλ为满足∥λ∥p=1‖λ‖p=1的方向向量。给定一目标向量F(x)=(f1(x),...,fm(x))F(x)=(f1(x),...,fm(x)),F¯(x)=(f¯1(x),...,f¯m(x))F¯(x)=(f¯1(x),...,f¯m(x))满足两个约束:1)F¯(x)F¯(x)与F(x)F(x)具有相同的适应值,即,gptch(F(x)|λ,z∗)=gptch(F¯(x)|λ,z∗)gptch(F(x)|λ,z∗)=gptch(F¯(x)|λ,z∗);2)F¯(x)F¯(x)位于直线L3L3上,如图1(f)所示。那么, 
gptch(F(x)|λ,z∗)=∥∥F¯(x)−z∗∥∥pgptch(F(x)|λ,z∗)=‖F¯(x)−z∗‖p(12)

证明 由F¯(x)F¯(x)的组成,我们能得到 
gptch(F(x)|λ,z∗)===1)gptch(F¯(x)|λ,z∗)==================2) F¯(x) is in L3  Proposition 3.1∥∥F¯(x)−z∗∥∥p      ■gptch(F(x)|λ,z∗)===1)gptch(F¯(x)|λ,z∗)==================2) F¯(x) is in L3  Proposition 3.1‖F¯(x)−z∗‖p      ◼ 
根据F¯(x)F¯(x)的两个约束,我们能得到 
F¯(x)=(f¯1(x),...,f¯m(x))=z∗+gptch(F(x)|λ,z∗)⋅λF¯(x)=(f¯1(x),...,f¯m(x))=z∗+gptch(F(x)|λ,z∗)⋅λ

例如,给定p=2p=2,F(x)=(0.5,2)F(x)=(0.5,2),λ=(1/5–√,2/5–√)λ=(1/5,2/5),及z∗=(0,0)z∗=(0,0),我们可以计算 
g2tch(F(x)|λ,z∗)=max{0.5−01/5–√,2−02/5–√}=5–√,g2tch(F(x)|λ,z∗)=max{0.5−01/5,2−02/5}=5, 
f¯1(x)=z∗1+g2tch(F(x)|λ,z∗)⋅λ1=0+5–√⋅1/5–√=1,f¯1(x)=z1∗+g2tch(F(x)|λ,z∗)⋅λ1=0+5⋅1/5=1, 
f¯2(x)=z∗2+g2tch(F(x)|λ,z∗)⋅λ2=0+5–√⋅2/5–√=2.f¯2(x)=z2∗+g2tch(F(x)|λ,z∗)⋅λ2=0+5⋅2/5=2.


B. 改进Tchebycheff分解与pp-Tch的关系

改进Tchebycheff分解与pp-Tch在构造子问题时具有相似之处,即, 
gptch(F(x)|λ,z∗)======λ=w∥w∥pgptch(F(x)|w∥w∥p,z∗)gptch(F(x)|λ,z∗)======λ=w‖w‖pgptch(F(x)|w‖w‖p,z∗) 
===(8)max1≤i≤m⎧⎩⎨fi(x)−z∗iwi∥w∥p⎫⎭⎬=∥w∥p⋅max1≤i≤m{fi(x)−z∗iwi}===(8)max1≤i≤m{fi(x)−zi∗wi‖w‖p}=‖w‖p⋅max1≤i≤m{fi(x)−zi∗wi} 
===(5)∥w∥p⋅gmtch(F(x)|w,z∗)===(5)‖w‖p⋅gmtch(F(x)|w,z∗)(13)

其中,pp-Tch与改进Tchebycheff分解的不同之处在于产生权重因子∥w∥p‖w‖p的方法。 
式(13)可以被一般化。更具体来说,若g(F(x)|w,z∗)g(F(x)|w,z∗)表示一个分解方法(如,传统Tchebycheff分解,改进Tchebycheff分解,加权和方法【20】或PBI方法【3】)的子问题,那么,那么一个泛化的子问题目标函数可以定义为c(w)⋅g(F(x)|w,z∗)c(w)⋅g(F(x)|w,z∗),其中,c(w)c(w)为只依赖于权重向量ww的系数,且对于任何ww有c(w)>0c(w)>0。在pp-Tch中,c(w)=∥w∥pc(w)=‖w‖p。 
这里写图片描述


C. 提出的泛化子问题的优点

泛化子问题相比于原始子问题的优点在于泛化能够调整子问题在竞争中的重要性/权重,这对应其被后代解更新的几率。

1) 通过划分可行目标空间调节子问题的重要性:c(w)c(w)能被看作为子问题的权重/重要性。子问题偏好区域的定义可以介绍如下: 
Υi={F(x)|x∈Ω,argmin1≤i≤N{c(wj)⋅g(F(x)|wj,z∗)}=i}Υi={F(x)|x∈Ω,arg⁡min1≤i≤N{c(wj)⋅g(F(x)|wj,z∗)}=i}(14) 
其中,NN为子问题的个数。在ΥiΥi中,c(wi)⋅g(F(x)|wi,z∗)c(wi)⋅g(F(x)|wi,z∗)为所有c(wj)⋅g(F(x)|wj,z∗), j=1,...,Nc(wj)⋅g(F(x)|wj,z∗), j=1,...,N中的最小的。其他定义子问题偏好区域的方法可参见【25,26】。

这里写图片描述

这里写图片描述

基于(14),c(w)c(w)对于用改进Tchebycheff分解划分可行目标空间的影响如图2和表I所示。

在图2,使用了c(w)=∥w∥4pc(w)=‖w‖p4且pp在三张子图中分别被设为0.10.1,0.50.5,和1.51.5。图表表明,提高pp值会缩小边界问题的偏好区域,即,与w1w1和w3w3关联的子问题,会增加居间问题的偏好区域,即,与w2w2关联的第二个子问题。表I总结了泛化子问题偏好区域占可行目标空间的比率。

调节c(w)c(w)能调整子问题偏好区域,因此,更多的更新机会会被分配到更感兴趣的子问题从而加速其收敛。例如,MOEA/D用三个子问题在双目标ZDT4【27】和DTLZ4【28】问题的测试如图2所示。广泛使用的模拟二进制交叉(simulated binary crossover,SBX)和多项式变异(polynomial mutation)【29】应用于生成子代。使用c(w)c(w)的不同设定,关联于w1w1的第一个子问题拥有最大的偏好区域,示于图2(a),且收敛最快,示于图3(a)和(b),这对应于c(w)=∥w∥40.1c(w)=‖w‖0.14。同样地,当c(w)=∥w∥41.5c(w)=‖w‖1.54时,第二个子问题具有三者中最大的偏好区域,如图2所示,并取得了最快的收敛率,如图3(c)和(d)所示。观察可以得出,具有更大偏好区域的子问题更有可能被频繁更新,不断被改善,这将导致更快的收敛率。

这里写图片描述

提升划分全部子问题改善空间的均匀度:为阐明这一问题,基于最大适应度提升标准,我们首次如下给出子问题改善区域的定义: 
Υi={F(y)|y∈Ω,g(F(y)|wi,z∗)<g(F(xi)|wi,z∗),Υi={F(y)|y∈Ω,g(F(y)|wi,z∗)<g(F(xi)|wi,z∗), 
i=argmax1≤j≤N{c(w)⋅[g(F(xi)|wj,z∗)−g(F(y)|wj,z∗)]}}i=arg⁡max1≤j≤N{c(w)⋅[g(F(xi)|wj,z∗)−g(F(y)|wj,z∗)]}} 
其中,xixi为第ii个子问题的当前解。不等式g(F(y)|wi,z∗)<g(F(x)|wi,z∗)g(F(y)|wi,z∗)<g(F(x)|wi,z∗)表明子代yy对于第ii个子问题比当前解xx具有更好的适应值。(15)中最后的约束确认取得最大适应值提升的子问题。

这里写图片描述

一个所有子问题提升区域的示例如图4(d)所示。通过使用(15)和改进Tchebycheff分解,c(w)c(w)对所有子问题提升区域的划分的影响示于图4(a)-(c)。使用了c(w)=∥w∥pc(w)=‖w‖p,且在图4(a)-(c)中2,pp分别被设为1/31/3,11,和33。结果表明,提升pp值能提升划分所有子问题提升区域的均匀度。此现象对于可行目标空间的边界区域更为明显,即,图4(a)-(c)中的Υ1Υ1和Υ4Υ4。

通过c(w)c(w),算法能够调节提升区域的均匀度以提高算法的性能。一个简单的示例如图4(a)-(c)所示,其中,MOEA/D融合了使用不同c(w)c(w)设定的四个均匀的子问题。双目标ZDT4和DTLZ4问题被选作测试问题。多项式变异和SBX应用于生成子代。第ii个子问题的当前解将被子代yy更新,若其对应的目标向量位于ΥiΥi。提升区域的均匀划分将使所有的子问题得到更好的一般结果,如图4(e)-(f)所示。


IV. 基于最大适应值改善的种群更新策略

种群更新机制是MOEAs的关键组成,近年来已被充分研究。例如,基于差分进化(differential evolution,DE)【17】的MOEA/D,其限制了一个子代解能更新的父代解的数目。自适应全局替换MOEA/D(MOEA/D with an adaptive global replacement,MOEA/D-AVR)【19】基于最小函数值用一个新生成解替换父代解。基于稳定匹配模型的MOEA/D【30】在更新种群时,使用了一个稳定匹配模型来使每个子问题与一个单一解匹配,因此不同子问题有不同解。为提升种群的多样性,Li等人【31】进一步提出了基于交互关系的选择来选取精英解使其在进化过程中存活。基于一种泛化资源调度策略的MOEA/D【32】使用一种全局替换策略更新子问题解。这些种群更新策略已成功地提升了MOEA/D的性能,然而,它们大多是设计用于只是优化了一部分子问题的表现【17】【19】【32】。

这里写图片描述

为提升算法性能,本文提出了一种基于最大适应值提升的全局种群更新策略,示于算法1。尤其,对于目标子问题给定一般解yy,在算法1的前两步,yy能够取得最大适应值提升的子问题ll可以识别如下

l=argmax1≤i≤N{gptch(F(xi)|λi,z∗)−gptch(F(y)|λi,z∗)}l=arg⁡max1≤i≤N{gptch(F(xi)|λi,z∗)−gptch(F(y)|λi,z∗)} (16)

之后,在第3步,相应的解xlxl被yy替换,若yy在子问题ll的表现优于xlxl。最后,为提升所提出的算法的鲁棒性,少量的父代解(不超过一个预定义的数目nr−1nr−1)同样被随机选择并被yy替换,如第4步所示。使用不同pp-Tchs的影响在实验研究中被考察,其基于如下公式:

gptch(F(xi)|λi,z)−gptch(F(y)|λi,z)======(13)wi=λi/∥λi∥1∥wi∥p⋅[gmtch(F(xi)|wi,z)−gmtch(F(y)|wi,z)]gptch(F(xi)|λi,z)−gptch(F(y)|λi,z)======wi=λi/‖λi‖1(13)‖wi‖p⋅[gmtch(F(xi)|wi,z)−gmtch(F(y)|wi,z)]

算法1给出的种群更新策略基于pp-Tch,但是,在实验研究中使用的是2-Tch。选择p=2p=2的原因是,首先pp应该大于1,以提升子问题更新区域的均匀度,并且,p=2p=2优于p>2p>2,因为,相比于其他更大的pp值,在2-Tch中,对于欧氏距离来说,子问题目标函数具有一个更加清晰的几何属性。2-Tch的一个子问题定义如下:

minx∈Ωg2tch(F(x)|λ,z∗)=max1≤i≤m{fi(x)−z∗iλi}minx∈Ωg2tch(F(x)|λ,z∗)=max1≤i≤m{fi(x)−zi∗λi} (17)

其中,λ=(λ1,…,λm)λ=(λ1,…,λm)且∥λ∥2=1‖λ‖2=1及λ1,…,λm≥0λ1,…,λm≥0。

这里写图片描述

在算法1中,适应值的提升使用gptch(F(xi)|λi,z)−gptch(F(y)|λi,z)gptch(F(xi)|λi,z)−gptch(F(y)|λi,z)进行计算。此适应值提升在2-Tch的相应的几何属性示于图5。按照命题6,适应值提升计算如下:

g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)=∥F¯¯¯¯(xi)−z∥2−∥F¯¯¯¯(y)−z∥2=∥F¯¯¯¯(xi)−F¯¯¯¯(y)∥2g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)=‖F¯(xi)−z‖2−‖F¯(y)−z‖2=‖F¯(xi)−F¯(y)‖2

其中

F¯¯¯¯(xi)=z+g2tch(F(xi)|λi,z)⋅λiF¯(xi)=z+g2tch(F(xi)|λi,z)⋅λi 
F¯¯¯¯(y)=z+g2tch(F(y)|λi,z)⋅λiF¯(y)=z+g2tch(F(y)|λi,z)⋅λi

其实,这是F¯¯¯¯(y)F¯(y)到F¯¯¯¯(xi)F¯(xi)的距离,如图5所示。

与其他两种具有代表性策略,即MOEA/D-AGR使用的基于最小适应值的策略与MOEA/D使用的随机提升策略,所提出的基于最大适应值提升的策略具有如下优点:

这里写图片描述

  1. 好的子代个体在提出的策略中能够存活更长时间。为解释这一点,适应值提升与适应值的区别首先可以使用一个双目标优化问题在图6进行说明。比如,在用一个子代yy更新了一个特定子问题ii之后,相应的适应值提升g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)和新的适应值g2tch(F(y)|λi,z)g2tch(F(y)|λi,z)分别使用实线和虚线部分表示。按照图6的注释,一个两步的例子进一步示于图7,以区分三种种群更新策略的工作过程。尤其,两个有潜力的解yy和y1y1被生成,并用于依次更新种群。在图7(a)的例子中,第一个有潜力的子代解yy占优三个父代解x2x2,x3x3和x4x4。解yy在第三个子问题同时取得最大适应值提升与最小适应值由于: 
    argmax1≤i≤5[g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)]=3arg⁡max1≤i≤5[g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)]=3 
    argmin1≤i≤5 g2tch(F(y)|λi,z)=3arg⁡min1≤i≤5 g2tch(F(y)|λi,z)=3 
    因此,在第一步中,基于最大适应值提升与最小适应值的种群更新策略使用子代yy更新x3x3,分别示于图7(b)和(d)。MOEA/D所用的策略随机替换一个可提升的父代个体,比如图7(f)的x2x2。为清晰起见,一个新生成的子代解yy用于替换最多一个父代个体,即,nr=1nr=1,示于图7。在第二步,如图7(b),(d)和(f)所示,给定第二个潜力解y1y1,三种策略分别用y1y1替换了x4x4,x3x3与x2x2,如图7(c),(e)和(g)所示。其原因如下: 
    argmax1≤i≤5[g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)]=4arg⁡max1≤i≤5[g2tch(F(xi)|λi,z)−g2tch(F(y)|λi,z)]=4 
    argmin1≤i≤5 g2tch(F(y)|λi,z)=3arg⁡min1≤i≤5 g2tch(F(y)|λi,z)=3 
    在图7(f)中,MOEA/D所用的更新策略能够随机用y1y1替换x2x2或x3x3。图7(g)假定x2x2被y1y1替换。可以观察到,所提出的基于最大适应值提升策略成功地保留了第一个潜力个体yy,即,图7(c)中的x3x3,然而,另两个策略舍弃了yy,如图7(e)和(g)所示。换句话说,在提出的更新策略中,好的解更可能幸存。 
    这里写图片描述
  2. 提出的策略提升了在所有子问题上的泛化性能,即,∑Ni=1g2tch(F(xi)|λi,z∗)∑i=1Ng2tch(F(xi)|λi,z∗),而不是部分子问题。使用∑Ni=1g2tch(F(xi)|λi,z∗)∑i=1Ng2tch(F(xi)|λi,z∗)来评估整个种群性能的合理性亦将在节VI的R2tch2R22tch指标(20)的定义中解释。给定一个种群A={x1,…,xN}A={x1,…,xN},如下假定是合理的: 
    g2tch(F(xi)|λi,z∗)=minF(x)∈A{g2tch(F(x)|λi,z∗)}g2tch(F(xi)|λi,z∗)=minF(x)∈A{g2tch(F(x)|λi,z∗)} 
    其中,xixi为MOEA/D中子问题ii的当前最优解。理想目标向量z∗z∗一般是事先未知的,故【3】中提出的用参考点zz估计z∗z∗的方法在本文采用了。所有子问题的一般性能能够通过将AA中所有个体的适应值相加而进行估计,其为 
    g2tch(F(A)|D,z)=∑i=1Ng2tch(F(xi)|λi,z)g2tch(F(A)|D,z)=∑i=1Ng2tch(F(xi)|λi,z) 
    其中,D={λ1,…,λN}D={λ1,…,λN}且较小的g2tch(F(A)|D,z)g2tch(F(A)|D,z)意味着整个种群或所有子问题的较好的一般性能。

令所有三个比较的策略由同一初始种群AA开始,一个新生成的子代解yy用于只替换一个父代解。不失一般性,提出的基于最大适应值提升的策略应该更新子问题ll,而其他两种策略更新子问题jj。根据(16)中最大适应值提升的定义,很明显:

g2tch(F(xl)|λl,z)−g2tch(F(y)|λl,z)≥g2tch(F(xj)|λj,z)−g2tch(F(y)|λj,z)g2tch(F(xl)|λl,z)−g2tch(F(y)|λl,z)≥g2tch(F(xj)|λj,z)−g2tch(F(y)|λj,z)

相应地,更新子问题ll得到的新种群的适应值和小于或等于更新子问题jj的,即:

g2tch(F(A)|D,z)−g2tch(F(xl)|λl,z)+g2tch(F(y)|λl,z)≤g2tch(F(A)|D,z)−g2tch(F(xj)|λj,z)+g2tch(F(y)|λj,z)g2tch(F(A)|D,z)−g2tch(F(xl)|λl,z)+g2tch(F(y)|λl,z)≤g2tch(F(A)|D,z)−g2tch(F(xj)|λj,z)+g2tch(F(y)|λj,z)

换句话说,提出的策略能够在所有子问题上得到更好的一般性能,相比于另外两种在MOEA/D和MOEA/D-AGR使用的更新策略。


V. 提出的MOEA/D-2TCHMFI的细节

这里写图片描述

2-Tch与提出的基于最大适应值改进的种群更新策略被组合到MOEA/D框架中,以组成新算法,称为MOEA/D-2TCHMFI。MOEA/D-2TCHMFI致力于就解的收敛性而言,提升MOEA/D,在算法2进行了概述。权重向量/方向向量的选择对于寻找在PF均匀分布的解是关键的。对于一个分解方法,权重的一种最优分布能够根据【5】-【7】得到,若一个MOP的PF的几何形状是事先知道的,且提供了分布良好的Pareto最优解集的清晰定义的话。

这里写图片描述

在算法2中,步骤1设置方向向量{λ1,…,λN}{λ1,…,λN}如下:

λi=wi∥wi∥2, i=1,…,Nλi=wi‖wi‖2, i=1,…,N

其中,{w1,…,wN}{w1,…,wN}为由【3】中建议的方法随机生成的权重向量。均匀权重向量{w1,…,wN}{w1,…,wN}及相应的方向向量{λ1,…,λN}{λ1,…,λN}的可视化在图8中。步骤2仅选择了⌊N/5⌋⌊N/5⌋子问题,这基于它们在每一代生成子代的最近的表现。步骤3使用2-Tch与基于最大适应值提升标准的种群更新策略来迭代地进化选择的子问题。尤其地,在步骤3.1中,每个子问题通过主要来自其邻域的子问题的信息进行优化。参考点zz在步骤3.2更新,父代解在步骤3.3根据算法1进行更新。在步骤3.4中,若代数gengen可以被3030整除,子问题ii的适应值在近30代的相应的减少计算如下:

Δi=g2tch(F(xi,gen−30)|λi,z)−g2tch(F(xi,gen)|λi,z)g2tch(F(xi,gen−30)|λi,z)Δi=g2tch(F(xi,gen−30)|λi,z)−g2tch(F(xi,gen)|λi,z)g2tch(F(xi,gen−30)|λi,z)

其中,xi,genxi,gen与xi,gen−30xi,gen−30分别为在当前代与代数gen−30gen−30时子问题ii的解。根据【16】,MOEA/D-2TCHMFI基于ΔiΔi更新每个子问题πi, i=1,…,Nπi, i=1,…,N,如下:

πi=1,if Δi>0.001πi=1,if Δi>0.001 
πi=(0.95+0.05×Δi0.001)×πi,otherwiseπi=(0.95+0.05×Δi0.001)×πi,otherwise

最后,在步骤4,若达到预定义的最大适应值评估次数,算法终止。


VI. 基于2-Tch的一元R2R2指标

为证实所提算法的有效性,本节介绍了一种基于2-Tch的R2R2指标。R2R2首先由Hanson与Jaszkiewicz【15】在1998年提出。最近,R2R2指标日益吸引到了研究兴趣【33】-【38】。R2R2指标的大多数研究【15】,【34】-【38】是基于传统的Tchebycheff分解的,少数【33】基于改进的Tchebycheff分解。然而,基于这两种Tchebycheff分解方法的R2R2指标的几何属性并不易懂。在这里,具有更清晰的几何属性的新的R2R2指标被提出以估计超体积度量,如下:

R2tch2(A|z∗)=∫λ∈ΛminF(x)∈A{g2tch(F(x)|λ,z∗)}du∫ΛduR22tch(A|z∗)=∫λ∈ΛminF(x)∈A{g2tch(F(x)|λ,z∗)}du∫Λdu (18)

其中

Λ={λ=(λ1,…,λm)|λi≥0, i=1,…,m, ∥λ∥2=1}Λ={λ=(λ1,…,λm)|λi≥0, i=1,…,m, ‖λ‖2=1}

且dudu为在ΛΛ上的Lebesgue度量【39】。若没有决策者(DM)的参考信息,可以合理地假定方向向量λλ服从ΛΛ上的一个均匀分布。∫Λdu∫Λdu等于2−m2−m倍的mm维单位超球的表面积,因为ΛΛ为单位超球表面在第一象限的部分,其中,mm为目标函数的数目。子问题目标函数g2tch(F(x)|λ,z∗)g2tch(F(x)|λ,z∗)可看作为DM的一个效用函数/参照【20】。给定种群AA的所有个体中的选择权,DM倾向于选择具有minF(x)∈A{g2tch(F(x)|λ,z∗)}minF(x)∈A{g2tch(F(x)|λ,z∗)}的那一个,示于图9(a)。R2tch2(A|z∗)R22tch(A|z∗)越小,DM所期望的效用/参照就越好。

这里写图片描述

所提出的R2tch2R22tch度量的几何属性示于图9(b)。尤其,一个点P¯¯¯¯iP¯i被引入以便于minF(x)∈A{g2tch(F(x)|λi,z∗)}minF(x)∈A{g2tch(F(x)|λi,z∗)}的计算,即:

minF(x)∈A{g2tch(F(x)|λi,z∗)}=∥P¯¯¯¯i−z∗∥2minF(x)∈A{g2tch(F(x)|λi,z∗)}=‖P¯i−z∗‖2

很容易证明:

R2tch2(A|z∗)≈∑Mi=1minF(x)∈A{g2tch(F(x)|λi,z∗)}MR22tch(A|z∗)≈∑i=1MminF(x)∈A{g2tch(F(x)|λi,z∗)}M 
=∑Mi=1∥P¯¯¯¯i−z∗∥2M=∑i=1M‖P¯i−z∗‖2M

其中,MM为方向向量集的大小。因此,所提出的R2tch2(A|z∗)R22tch(A|z∗)指标的几何属性实际上为连接z∗z∗与P¯¯¯¯iP¯i的线段的平均长度。P¯¯¯¯iP¯i的分布很适合估计集A={x1,x2,x3,x4}A={x1,x2,x3,x4}的超体的表面。按【35】的建议,R2tch2(A|z∗)R22tch(A|z∗)能够用于估计集AA的超体积。(20)中的一个简化的形式的解释提供于补充材料的附录A中。如补充材料的附录B所证明,所提出的一元指标R2tch2R22tch(DM所期望的效用/参考)是对于Pareto占优严格单调的,这对于一种评估指标【40】是必要的。

这里写图片描述

基于2-Tch的R2R2指标对于另外两种基于传统Tchebycheff分解和改进的Tchebycheff分解的指标的优势示于图10。通过分别用gtch(F(x)|w,z∗)gtch(F(x)|w,z∗)与gmtch(F(x)|w,z∗)gmtch(F(x)|w,z∗)替换(18)中的g2tch(F(x)|λ,z∗)g2tch(F(x)|λ,z∗),可以令Rtch2(A|z∗)R2tch(A|z∗)与Rmtch2(A|z∗)R2mtch(A|z∗)分别表示这两种指标。图10展示了R2tch2(A|z∗)R22tch(A|z∗),Rtch2(A|z∗)R2tch(A|z∗)与Rmtch2(A|z∗)R2mtch(A|z∗)在一个双目标优化问题中的几何含义。R2tch2(A|z∗)R22tch(A|z∗),Rtch2(A|z∗)R2tch(A|z∗)与Rmtch2(A|z∗)R2mtch(A|z∗)分别为从理想点z∗z∗到曲线1-3的平均距离。可以从图10(a)看出,R2tch2(A|z∗)R22tch(A|z∗)表示从理想点z∗z∗到非占优解集的超体表面的的平均距离。相比而言,Rtch2(A|z∗)R2tch(A|z∗)与Rmtch2(A|z∗)R2mtch(A|z∗)均不能表明与非占优解集的分布的直观关系,示于图10(b)和(c)中。


VII. 实验研究

这里写图片描述 
这里写图片描述 
这里写图片描述

这里写图片描述 
这里写图片描述

这里写图片描述 
这里写图片描述

这里写图片描述 
这里写图片描述

这里写图片描述


参考文献

这里写图片描述 
这里写图片描述 
这里写图片描述 
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值