多目标优化系列(四)RM-MEDA

RM-MEDA: A Regularity Model-Based Multiobjective Estimation of Distribution Algorithm
原文:http://ieeexplore.ieee.org/document/4358761/

摘要

该文的中文题目是:基于规则模型的多目标估计分布算法。

引言

当前的MOEA研究主要集中在以下高度相关的问题上。

  • 合理分配和多样性:由于帕累托支配不是一个完整的排序,原来开发用于标量目标优化的常规选择算法不能直接应用于多目标优化。此外,大多数的MOEAs的任务是产生一系列均匀分布在帕累托前沿面的解。然而,为每个单独的解分配相应的适应度值,以反映其在MOEAs选择中的效用并不是一件简单的事。

  • 外部种群:当前的MOEAs很难平衡多样性与单一在线种群的融合。在线种群因为其大小有限,可能无法在搜索期间存储一些代表性的解。为了解决这个问题,MOEAs经常使用外部种群来存储搜索过程中找到的非支配解。

  • MOEA和本地搜索的融合:EA和本地启发式搜索(通常称为模拟算法)的融合已被证明在各种标量目标优化中由于传统的进化算法。

在轻度平滑的条件下,连续的MOP的帕累托集(在决策空间中)是分段连续的(m-1)维流型。这是该文的前提。
分布估计算法(EDAs)是进化算法中的一种新的计算模式。EDAs中没有交叉或者变异,相反,他们从所选解中提取全局统计信息,并基于提取的信息构建有希望的解决方案的后验概率分布模型。从所建立的模型中抽取新的解决方案,全部或部分取代旧的种群。

算法

step0.初始化: 初始化种群Pop(t)中的每个个体对应的目标函数值F,令t=0;
step1.停止条件: 如果停止满足条件,停止并返回Pop(t)中的Pareto解集和对应的目标函数向量F;
step2.建立模型: 根据种群Pop(t)中的解的分布建立一个概率模型;
step3.产生新解: 从建立好的模型中选择一个新的解集Q,评价Q中的每一个解的F值;
step4.排序选择: 从Pop(t)并Q 中选取N个个体作为新的种群Pop(t);
step5.: 令t=t+1,转步骤1。

望读者仔细斟酌上面的步骤,我们可以发现,该算法就是根据解集构造模型然后又从模型中构造新的解集,然后同该代原始解结合生成下一代解。那么问题来了,我们应该怎样构造模型,构造什么样的模型,接下来我会稍微讲解下,由于本片文章作者还没完全搞懂,不足之处还请指正,对该算法有研究的同学可以联系我(求大神赐教) QQ:1007705026

基本思想:

由于Pareto set是分段的(m-1)维的流型,我们希望种群中的点尽可能逼近理想Pareto Set,并均匀分布在理想set的周围。该算法将种群中的个体看作随机变量ξ的独立观测量,,其中占ξ属于Rn,n是决策变量的维度,这些观测量的质心正好构成Pareto Set。故ξ可描述为:
ξ= ζ+ ε
上式中的ζ均匀分布在m-1维流形周围,是算法需要建立的分布模型。ε是一个n维的均值为零的噪声向量,表示种群中的个体在流型周围的随机扰动,具体情况如下:
所示

建模:

使用(m-1)维Local PCA算法,将Pop(t)划分为K聚类;S1,S2……Sk。
这里写图片描述
上述图片为聚类后的结果,从图中看以看出,该模型被分为3 个聚类。

这里写图片描述

这里写图片描述

这里写图片描述

采样 产生新解

这里写图片描述

这里写图片描述
这里公式2-5即上述公式

结束

或者大部分读者看到这里一脸懵逼,这是什么鬼,干嘛的,与基本思想里的公式有关系吗,当然了,下面这张图片就是关系,ζ是从 ψj 上均匀随机产生的,而ε 则是服从与σ有关的正态分布。该算法的主要原理就是通过原始解构造一个分布模型,然后从这个模型选择一些点,加上噪声产生新的解,具体实现还需要读者看论文。
这里写图片描述

在此,终于把4篇文章搞完了,虽然还有许多欠缺,但也足够我消化一段时间了。自我感觉最优化学习需要小伙伴们讨论交流,感谢杜师兄,刘师姐以及李同学对本系列的指导。

[1] 许霞. 改进的多目标分布式估计算法在水火电系统负荷分配的应用[D]. 西安电子科技大学, 2013.
[2] 任元. 基于EDA和自适应进化策略的多目标优化方法研究[D]. 西安电子科技大学, 2013.
[3] 詹炜. 求解高维多目标优化问题的流形学习算法研究[D]. 中国地质大学, 2013.

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值