EMT-DAVT–基于子空间分布对齐和决策变量转移的多目标多任务优化
title: Multiobjective Multitasking Optimization With Subspace Distribution Alignment and Decision Variable Transfer
author: Weifeng Gao, Jiangli Cheng, Maoguo Gong, Hong Li, and Jin Xie.
journal: IEEE TRANSACTIONS ON EMERGING TOPICS IN COMPUTATIONAL INTELLIGENCE (TETCI)
DOI:10.1109/TETCI.2021.3115518
code:
1.主要贡献:
EMT-DAVT包含子空间分布对齐(DA)策略和决策变量转移(VT)机制。在DA策略中,利用学习映射矩阵对齐子空间中的分布,减少属于不同任务的子种群之间的差异。然后,使用VT机制进一步促进正向信息传递。最后,设计了一种搜索策略来平衡探索和开发。
2.问题提出:
许多迁移学习方法被应用到多任务优化中,如EMEA、MO-MFEA-II、MOMFEA-SADE等,但是这些算法还是会带来负迁移,主要原因如下:
1)迁移个体的质量依赖于任务的相似度,而任务相似度是不确定的;并且当任务间相似度较低时,映射矩阵也可能是不准确的。
2)由于每个个体都有相同的概率被选中,所以一些低质量的个体也可能会被选择去交换信息;
3)常用的子空间对齐方法忽略了种群的平稳分布,使得目标空间中的预测个体缺乏多样性。
如图所示,假设红色方块表示从源任务迁移的个体,蓝色圆圈表示目标任务的种群。对于最小化问题来说,直接迁移个体不会帮助目标任务的搜索。
# 3.EMT-DAVT:3.1 子空间分布对齐策略(DA)
领域自适应可以通过建立一种映射矩阵来对齐子空间的偏差,但是这些方法没有考虑到子空间分布信息的散度,导致在自适应之后还是未对齐。为此,文章中提出了一种DA策略,它将源域和目标域投影到相应的低维子空间中,然后在两个子空间之间建立两个映射矩阵 M s t M_{st} Mst和 M t s M_{ts} Mts。与直接建立映射相比,该方法可以最小化两个域之间的差异。DA策略的细节介绍如下:
1)PCA降维得到分别属于种群 P s ∈ R N × D m a x , P t ∈ R N × D m a x × P_s\in R^{N\times D_{max}},P_t\in R^{N\times D_{max}\times} Ps∈RN×Dmax,Pt∈RN×Dmax×的子空间 S s ∈ R D m a x × h , S t ∈ R D m a x × h S_s\in R^{D_{max}\times h},S_t\in R^{D_{max}\times h} Ss∈RDmax×h,St∈RDmax×h
2)构建两个子空间的映射矩阵如下:
M
s
t
=
Q
s
t
A
s
t
M_{st}=Q_{st}A_{st}
Mst=QstAst
其中,
A
s
t
A_{st}
Ast是用来对齐子空间分布的矩阵,
Q
s
t
Q_{st}
Qst是用来对齐偏差的矩阵,且是通过最小化Bregman矩阵散度损失构建:
F
(
Q
s
t
)
=
∣
∣
S
s
Q
s
t
−
S
t
∣
∣
F
2
F(Q_{st})={||S_s Q_{st}-S_t||}^2_F
F(Qst)=∣∣SsQst−St∣∣F2
Q s t ∗ = arg min Q s t ∈ R h × h F ( Q s t ) = S s T S t Q^*_{st}=\arg \min_{Q_{st\in R^{h \times h}}} F(Q_{st})=S^T_s S_t Qst∗=argQst∈Rh×hminF(Qst)=SsTSt
3)构建矩阵
A
s
t
A_{st}
Ast:首先通过归一化使得均值不会影响子空间的映射,则
A
s
t
A_{st}
Ast就可以直接在子空间中通过
P
s
P_s
Ps和
P
t
P_t
Pt的协方差矩阵构建。
A
s
t
=
W
s
−
1
W
t
=
E
s
−
1
2
E
t
1
2
A_{st}=W^{-1}_s W_t=E^{-\frac 1 2}_s E^{\frac 1 2}_t
Ast=Ws−1Wt=Es−21Et21
其中,
W
s
,
W
t
W_s,W_t
Ws,Wt表示两个协方差矩阵的平方根,
E
s
,
E
t
E_s,E_t
Es,Et是两个子空间对应的特征值(通过PCA得到的)。因此最终的映射矩阵表示如下:
M
s
t
=
Q
s
t
∗
A
s
t
=
(
S
s
T
S
t
)
(
E
s
−
1
2
E
t
1
2
)
M_{st}=Q^*_{st}A_{st}=(S^T_s S_t)(E^{-\frac 1 2}_s E^{\frac 1 2}_t)
Mst=Qst∗Ast=(SsTSt)(Es−21Et21)
M t s = Q t s ∗ A t s = ( S t T S s ) ( E t − 1 2 E s 1 2 ) M_{ts}=Q^*_{ts}A_{ts}=(S^T_t S_s)(E^{-\frac 1 2}_t E^{\frac 1 2}_s) Mts=Qts∗Ats=(StTSs)(Et−21Es21)
4)一个个体
x
∈
P
s
x\in P_s
x∈Ps可以转换如下:
x
ˉ
=
x
⋅
S
s
⋅
M
s
t
⋅
S
t
T
\bar x=x\cdot S_s \cdot M_{st} \cdot S^T_t
xˉ=x⋅Ss⋅Mst⋅StT
3.2 决策变量迁移机制(VT)
采用无监督聚类的方式将 P t P_t Pt分成n类,聚类中心点表示为 C 1 t , C 2 t , . . . , C n t C^t_1,C^t_2,...,C^t_n C1t,C2t,...,Cnt,每一个聚类的点集表示为 B 1 t , B 2 t , . . . , B n t B^t_1,B^t_2,...,B^t_n B1t,B2t,...,Bnt。同理, P ˉ s \bar P_s Pˉs也被分为n类,聚类中心点表示为 C 1 s , C 2 s , . . . , C n s C^s_1,C^s_2,...,C^s_n C1s,C2s,...,Cns,每一个聚类的点集表示为 B 1 s , B 2 s , . . . , B n s B^s_1,B^s_2,...,B^s_n B1s,B2s,...,Bns。因为聚类中心更靠近于同一类的其他点,所以将聚类中心看作该聚类的代表点。
首先,点集
B
1
s
B^s_1
B1s中的所有点被迁移到点集
B
j
0
t
B^t_{j_0}
Bj0t通过如下计算:
p
ˉ
ˉ
1
,
s
i
=
p
ˉ
1
,
s
i
+
(
C
j
0
t
−
C
1
s
)
\bar {\bar p}^i_{1,s}={\bar p}^i_{1,s}+(C^t_{j_0}-C^s_1)
pˉˉ1,si=pˉ1,si+(Cj0t−C1s)
其中,
p
ˉ
1
,
s
i
{\bar p}^i_{1,s}
pˉ1,si表示聚类
B
1
s
B^s_1
B1s中第i个点,
p
ˉ
ˉ
1
,
s
i
\bar {\bar p}^i_{1,s}
pˉˉ1,si表示与
p
ˉ
1
,
s
i
{\bar p}^i_{1,s}
pˉ1,si对应的迁移点,
C
j
0
t
−
C
1
s
C^t_{j_0}-C^s_1
Cj0t−C1s代表两个聚类间的偏差。
3.3 搜索策略
1)任务内搜索策略:
“DE/rand/1”:
v
i
=
x
r
1
+
β
⋅
(
x
r
2
−
x
r
3
)
v_i=x_{r_1}+\beta\cdot(x_{r_2}-x_{r_3})
vi=xr1+β⋅(xr2−xr3)
“DE/best/1”:
v
i
=
x
b
e
s
t
+
β
⋅
(
x
r
1
−
x
r
2
)
v_i=x_{best}+\beta\cdot(x_{r_1}-x_{r_2})
vi=xbest+β⋅(xr1−xr2)
“DE/current-to-pbest/1”:
v
i
=
x
i
+
β
⋅
(
x
p
b
e
s
t
−
x
i
)
+
β
⋅
(
x
r
1
−
x
r
2
)
v_i=x_{i}+\beta\cdot(x_{pbest}-x_{i})+\beta\cdot(x_{r_1}-x_{r_2})
vi=xi+β⋅(xpbest−xi)+β⋅(xr1−xr2)
2)任务间搜索策略:
“DE/rand/1”变体:
v
i
=
x
r
1
+
β
⋅
(
x
~
r
2
−
x
~
r
3
)
v_i=x_{r_1}+\beta\cdot(\tilde x_{r_2}-\tilde x_{r_3})
vi=xr1+β⋅(x~r2−x~r3)
“DE/best/1”:
v
i
=
x
b
e
s
t
+
β
⋅
(
x
~
r
1
−
x
~
r
2
)
v_i=x_{best}+\beta\cdot(\tilde x_{r_1}-\tilde x_{r_2})
vi=xbest+β⋅(x~r1−x~r2)
“DE/current-to-pbest/1”:
v
i
=
x
i
+
β
⋅
(
x
~
p
b
e
s
t
−
x
i
)
+
β
⋅
(
x
~
r
1
−
x
~
r
2
)
v_i=x_{i}+\beta\cdot(\tilde x_{pbest}-x_{i})+\beta\cdot(\tilde x_{r_1}-\tilde x_{r_2})
vi=xi+β⋅(x~pbest−xi)+β⋅(x~r1−x~r2)
其中,索引
r
1
,
r
2
,
r
3
r_1,r_2,r_3
r1,r2,r3是从
[
1
,
2
N
]
[1,2N]
[1,2N]中选择的三个不同的随机数,
x
~
r
1
,
x
~
r
2
,
x
~
r
3
\tilde x_{r_1},\tilde x_{r_2},\tilde x_{r_3}
x~r1,x~r2,x~r3是从
P
s
P_s
Ps和
P
ˉ
ˉ
t
\bar{\bar P}_t
Pˉˉt的集合中随机采样的。
3.4 算法框架
1)初始化一个包含 K ⋅ N K\cdot N K⋅N个个体的种群并分配技能因子;
2)为每个任务 T k T_k Tk随机选择一个源任务 T s T_s Ts;
3)对 P s P_s Ps应用DA策略(算法2)获得 P ˉ s \bar P_s Pˉs;
4)对 P ˉ s \bar P_s Pˉs应用VT策略(算法3)获得 P ˉ ˉ s \bar{\bar P}_s Pˉˉs;
5)应用算法4来产生子代 C k C_k Ck
6)环境选择
# 4.思考1)EMT-DAVT中提出来两种策略:DA策略通过构建映射矩阵来对齐子空间分布,VT策略通过考虑源域与目标域中聚类中心间的距离来减少偏差。
2)领域自适应在MTO中的发展历程:整个高维矩阵的映射:EMEA是源域与目标域之间的直接映射,降维子空间的映射:MO-MFEA-SADE是源域与目标域的子空间之间的映射,EMT-DAVT是源域与目标域的子空间的聚类中心之间的映射,一维向量之间的映射:MFEA-GSMT、KR-MTEA是源域与目标域的维度之间的映射。