论文学习——基于类型检测的动态自适应多目标优化算法

论文题目:Dynamic adaptive multi-objective optimization algorithm based on type detection

基于类型检测的动态自适应多目标优化算法(Xingjuan Cai a,b, Linjie Wu a,∗, Tianhao Zhao a, Di Wu c, Wensheng Zhang d, Jinjun Chen e)Information Sciences 654 (2024) 119867

刚开始学习多目标优化算法,不作商业用途,如果有不正确的地方请指正!

个人总结:

摘要

  • 本文提出了一种自适应动态多目标进化类型检测算法( TDA-DMOEA )。
  • 首先,设计动态检测算子,识别动态问题的类型。采用Wilcoxon符号秩检验和超体积( Hyper Volume,HV )分别检测两个相邻环境下POS和POF的差异。
  • 针对DMOP的不同变化类型,设计了不同的响应策略。特别地,当面临POS和POF同时变化时,提出了一种基于闭核函数的多角度迁移学习方法( MA-TL )。

引言

目前大多数DMOEAs只能检测到环境发生了变化,并采用单一的应对策略进行应对,,从决策空间和目标空间等多个角度同时检测对DMOP类型识别也至关重要,目前,解决这一问题的理论非常有限

针对上述问题,本文提出了一种基于变化类型的DMOEA。该方法可以将环境变化的类型整合到响应途径中。根据不同类型的动态特征,可以自适应地唤醒不同的方法来估计变化的方向,并从目标和决策空间两个角度获得所有可能的动态变化。在DMOPs中,生成的初始种群被集成到现有的多目标进化算法( MOEAs )中,以解决该问题

本文提出的想法

  • 基于DMOP问题的特点,提出了一种动态检测机制。该机制可以根据POF和POS的变化幅度来判断动态问题的类型
  • 当只有POS发生显著性差异时,采用线性预测策略( LPS )的方法在决策空间中跟踪环境变化后产生的解。当只有POF发生剧烈变化时,采用膝点预测( KPP )策略
  • 当动态问题的POS和POF随环境同时变化时,为了更好地适应动态变化,建立了多角度TL方法来获取新环境下的动态POS。在该方法中,推导出具有封闭解的核函数,以处理不同类型的数据并减少预测的计算负担。

背景及相关工作

A.DMOP基础

B.作者提出的想法

为了有效地解决DMOPs,设计了一种基于变化类型TL的DMOEA。该算法包含3个重要部分。首先,设计了一种动态检测算子,通过Wilcoxon检验检测POS的变化,通过HV识别POF的变化。通过检测POS和POF的状态来识别基准测试函数的类型。然后,设计了环境响应机制。根据不同类型的测试集,自适应地激活不同的响应方法。特别地,当POS和POF同时变化时,在接下来的环境中很难得到精确的估计值。因此,我们设计了一种基于决策空间和目标空间的测地流核( GFK )流传递技术,可以应对th的变化

具体方法

A.算法框架

在前两个环境中,初始种群是随机产生的。利用静态多目标优化算法( SMOA )对生成的初始种群进行迭代进化,得到当前环境的POS。当只有POS发生改变时,LPS被诱发以响应环境的变化。当只有POF发生变化时,采用KPP策略来适应环境变化。当POS和POF同时变化时,同时考虑目标和决策空间,MA - TL旨在应对环境的变化,加速收敛到当前环境的最优解区间。如果环境不变,则使用SMOA获得初始个体

B.动态检测算子

1.POS检测

Wilcoxon检验用于比较两个样本组之间是否存在显著性差异,该方法用于检测两种POS在不同环境下的差异。当两组样本的p值小于0.05时,认为存在显著性差异。若P值大于或等于0.05,则认为两组样本之间无显著性差异。首先,定义μ t - 1和μ t - 2分别为POSt - 1和POSt - 1的质心,分别表示当前环境中所有POS在决策空间各维度下的均值。

删除D中的所有零点,得到D = [ D ( 1 ) , D ( 2 ) , ... , D ( size ( D ) )],并按绝对值进行排序。Wilcoxon符号秩统计量如下所示:

R +表示D中正差异的秩和,R -表示D中负差异的秩和𝑇 =min(𝑅+, 𝑅−),并计算观测值Z

最后,通过获取之后统计量的观测值来计算当前环境的p值:

其中,p _ valuet表示环境t中p的取值,φ为标准正态分布密度函数。 

2.POF检测

超体积( Hyper Volume,HV )值用于检测不同环境下POF之间的差异,本质上是比较多维数据之间的变异性,需要以数值的形式体现。

通过统一参考点计算POF和参考点,得到不同时刻的HV POF t值。该方法保留了样本间数据的相关性,能够较好地衡量不同多维数据样本间的变化差异

C.动态响应策略

1.LPS

本文使用的LPS模型以历史环境为导向,在决策空间中进行预测。利用前两个环境中POS的历史知识预测当前环境中的初始种群。

其中δ是标准差,I是单位矩阵。噪声的标准差是通过之前发生的变化得到的 

2.KPP

 

3.MA-TL 

一些我看起来糊里糊涂的就先不看

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值