(顶刊)基于关系模型的超多目标优化问题

《Expensive Multiobjective Optimization by Relation Learning and Prediction》

原文地址
IEEE Transactions on Evolutionary Computation ( Volume: 26, Issue: 5, October 2022)

摘要
使用了两两对比的比较模型,并非根据传统的支配关系建立样本对比较,而是依据MOEA/D中的PBI指标进行支配关系的标签建立和进行比较

创新点
1、使用了基于关系的分类模型,减少了回归模型的时间复杂度
2、对数据集进行了数据分割,使得训练样本标签分布基本是均匀的
3、使用多次模型结果综合判断,减少因为模型的预测错误而导致的判断错误
4、使用了基于径向过程的个体选择来保持多样性和收敛性

速看版本
在这里插入图片描述

图1 REMO的整体框架伪代码
  • 基本沿袭CSEA的基本思路,只是在模型和细节上有一些调整
  • 使用径向过程选定参考解,详见CSEA
  • 使用真实的目标函数与参考点集合依次进行PBI关系的对比,将种群分为nondominance和dominated,记作 P n 、 P d P_n、P_d PnPd
  • 分别在两个种群中选出点组成样本对,并根据所在的种群对该样本对打上标签[-1,+1,-0,+0]
  • 使用所得的样本对训练分类模型
  • 对原来的种群使用遗传方式产生后代新的个体,每个个体都需要与父代的个体形成四个样本对并用模型进行预测四次,四次的结果使用一个voting的得分计算该个体是非支配还是被支配的以决定是否要保留该个体
  • 最后还是使用径向方式进行投影并进行环境选择
  • 循环上述所有步骤,直到 F E > F E m a x FE > FE_{max} FE>FEmax

框架
在这里插入图片描述

图2 REMO的框架图示

1、初始化
生成初始种群,使用LHS采样方式

2、更新参考解
使用与CSEA相同的径向方法得到k个参考解,将这些解作为数据分割的分类边界

3、数据分割
根据PBI方法将种群P以分类边界分割为被支配的 P d P_d Pd,非支配的 P n P_n Pn两个子种群

4、模型构建和训练
分别从两个子种群依次取出样本对(pairs),打上标签,作为输入训练分类模型

5、模型辅助选择
使用交叉,变异等方式产生子代,每一个新产生的解将会和依次和所有父代的个体均产生4个样本对,并使用模型根据四次的结果由voting方法计算出一个得分,选出promising solution

6、存档更新和环境选择
在5中选择出的解将会由真实的目标函数进行评估从而更新存档Arc,接着从存档中选择N个个体形成新的种群

7、停止
循环2、3、4、5、6直到 F E > F E m a x FE > FE_{max} FE>FEmax

细节

1、数据分割
与CSEA中根据真实目标函数计算判断支配关系不同,这里使用的是PBI方法来判断一个解是不是非支配的,需要判断这个解的PBI值是否比与其夹角最小的一个参考点到理想点的距离小,即(1)式
Z = ( z 1 , z 2 , . . . , z m ) , z i = m i n x ∈ P f i ( x ) i = 1 , 2 , . . . , m Z=(z_1,z_2,...,z_m),z_i=\underset {x \in P}{min}f_i(x)\quad i=1,2,...,m Z=(z1,z2,...,zm)zi=xPminfi(x)i=1,2,...,m
P r e f = { x r e f 1 , x r e f 2 , . . . , x r e f k } P_{ref}=\{ x_{ref}^1,x_{ref}^2,...,x_{ref}^k\} Pref={xref1,xref2,...,xrefk}
在这里插入图片描述

在这里插入图片描述

图3 基于PBI的数据分割

根据PBI方法,当一个解满足 g p b i ( F ( x ) ∣ F ( x r e f i ∗ ) , Z ) < ∣ ∣ F ( x r e f i ∗ ) − Z ∣ ∣ i ∗ = a r g m a x i ∈ { 1 , . . . , k } c o s ( θ i ) (1) g^{pbi}(F(x)|F(x^{i^*}_{ref}),Z)<||F(x_{ref}^{i^*})-Z||\quad i^*=arg max_{i \in \{1,...,k \}}cos(\theta _i)\tag{1} gpbi(F(x)F(xrefi),Z)<∣∣F(xrefi)Z∣∣i=argmaxi{1,...,k}cos(θi)(1)我们就说这个解是非支配的。
根据二分搜索找到PBI的惩罚因子 δ \delta δ的最适区间,使得分类之后的 P n 和 P d P_n和P_d PnPd个体数量尽量接近

这里和传统的支配关系的分割稍有一点不一样,这样可以更好地利用有限的参考点,使得被支配的和非支配的尽量均衡
在这里插入图片描述

图4 基于PBI的数据分割与非支配分割比较

2、关系模型的构建和辅助选择

  • 形成样本对

分别从两个子种群 P n 、 P d P_n、P_d PnPd中选取个体形成样本对,因此最多有四种组合,根据PBI的值,它们的标签如下
在这里插入图片描述

  • 平衡训练样本

很明显 ∣ l ( 1 ) ∣ = ∣ l ( − 1 ) ∣ |l(1)|=|l(-1)| l(1)=l(1),而在 ∣ l ( + 0 ) ∣ 和 ∣ l ( − 0 ) ∣ |l(+0)|和|l(-0)| l(+0)l(0)中需要去除一些个体使得最终 ∣ l ( 1 ) ∣ = ∣ l ( − 1 ) ∣ = ∣ l ( 0 ) ∣ |l(1)|=|l(-1)|=|l(0)| l(1)=l(1)=l(0)

  • 网络结构
层数描述激活函数
输入层2维
隐层3n,2n,n
输出层3维向量使用one-hot编码得到[0\1,0\1,0\1]表示属于哪一类[+1,0,-1]
  • voting and scoring

根据以下式子计算每个生成的新解和父种群的解x的关系
在这里插入图片描述

其中 u \bold{u} u表示新生成的解, x \bold{x} x表示父种群的解,而 s ( u ) s(\bold{u}) s(u)表示新的个体 u \bold{u} u在子种群 P n P_n Pn中的可信度,4表示该解是非支配的,-4表示该解是被支配的,从而选择优秀的解进入下一代,根据得分的高低选择解,可以容忍模型的部分错误

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值