多目标优化_学习笔记（三）MOEA/D

最新推荐文章于 2025-03-29 18:54:18 发布

Erpim

最新推荐文章于 2025-03-29 18:54:18 发布

阅读量3w

点赞数 40

分类专栏：多目标优化文章标签：多目标优化 MOEA/D 切比雪夫 Tchebycheff

本文链接：https://blog.csdn.net/qq_35414569/article/details/79655400

版权

多目标优化专栏收录该内容

3 篇文章

订阅专栏

前言

本篇博客出于学习交流目的，主要是用来记录自己学习多目标优化中遇到的问题和心路历程，方便之后回顾。过程中可能引用其他大牛的博客，文末会给出相应链接，侵删！

REMARK：本人纯小白一枚，如有理解错误还望大家能够指出，相互交流。也是第一次以博客的形式记录，文笔烂到自己都看不下去，哈哈哈

笔记（二）记录基于Pareto支配的优化算法，在笔记（三）中记录在学习MOEA/D算法（包括对Tchebycheff聚合方法的理解，比较详细），MOEA/D也是我的直接目标，以为参考的那篇论文用到了这个论文的思想，因为对这个领域一点不了解，就有了前面两个笔记。（一些在第一篇提到的概念这篇就不再重复了）
正文

基于分解的多目标进化算法（MOEA/D）2007年由Qingfu Zhang等人提出。该算法将传统多目标问题转化成为多个单目标问题，对它们同时优化，该算法需要具备一定Pareto基础知识，可回顾多目标优化_学习笔记（一）。

MOEA/D特性：

引入分解的概念，简单但是有效；
由于算法将MOP问题分解成子问题（单维度）进行计算，适配度分配和多样性控制的难度都有所降低；
相较NSGA-II和MOGLS算法MOEA/D具有更低的计算复杂度，但在许多场景下解得表现上更为出色；
弥补传统不是基于分解的算法难以找到一个简单方法来利用标量（单维度）优化算法的缺点；

三种分解算法

一般将MOP多目标转换到一组标量优化问题常用的分解方法有权重求和法；切比雪夫聚合方法；边界交叉聚合方法。下面会一一解释这些方法，MOEA/D采用切比雪夫聚合方法，也可以只看这一部分。

A、权重求和法（Weighted Sum Approach ）
常用的权重求和公式为（最小化）：
$\; g^{ws}(x|\vec{\lambda })=\sum_{i=1}^m\lambda_if_i(x)$ $\; x\in \Omega$ 其中，待优化的目标分量有 $m$ 个， $\vec{\lambda }=\left ( \lambda_{1}，\lambda_{2}，\cdots ，\lambda_{m} \right )$ 是的权值向量，每个权值分量 $\lambda_{i}$ 分别对应第 $i$ 个目标分量；限制条件 $\lambda_{i}\geq 0$ && $\sum_{i=1}^m\lambda_{i}=1$ （如二维坐标，保证等高线斜率为 $\left [-0 ，-\infty \right ]$ ）。文章给出了利用线性加权法求Pareto解得图例，可以看下链接中的图例，有助于理解等高线（等值线）概念。利用这个方法可将多目标问题转换成单个数值目标函数，但在寻找非凸解得问题上难度大。

B、切比雪夫聚合方法（Tchebycheff Approach） $min\; g^{te}(x|\lambda,z^*)=max\; \{\lambda_i (f_i(x) - z_i^*)\}$ $\; x\in \Omega$

其中， $z^*=\left (z_1^*，\cdots ，z_i^* \right )$ $^T$ ，对于每一个目标分量 $i$ ， $z_i^*=min \left \{f_i(x) | x\in \Omega \right \}$ ，即每个目标分量最小值组成的坐标。

下面给出图例用于理解这个公式，首先感谢两篇博客，通过他们的分享给了我很大的启发，但是由于有些理解上的不同，下面给出我自己的理解，如有错误还请大家指正。

Chithonhttp://blog.csdn.net/qithon/article/details/72885053#comments
jinTesterhttp://blog.csdn.net/jinjiahao5299/article/details/76045936

针对我的理解和前人给出的图例我重新画了一个图，帮助理解。

以二目标最小优化问题为例，我们令 $f^{'}_i(x)=f_i(x) - z_i^*$ ，如图所示坐标系从 $f_i$ 变换到 $f^{'}_i$ ，这个过程对应定义很容易理解，之后的操作都针对这个变换后的坐标系;那么公式变为 $min\; g^{te}(x|\lambda)=max\; \{\lambda_i f^{'}_i(x)\}$ ，可以看出这个公式和线性加权的很像，只是线性加权是求和，而切比雪夫方法是比较最大值。

现在我们给定一个 $\vec{\lambda }$ ，如图紫线所示；我们的目标是要找到Pareto前沿面PF（红线）上的个体（点），给定 $\vec{\lambda }$ 之后，对位于 $\vec{\lambda }$ 上方的个体衡有 $f^{'}_1\lambda _{1}> f^{'}_2\lambda _{2}$ ，即 $min\; g^{te}(x|\lambda,z^*)=f^{'}_1\lambda _{1}$ ，无论$ f^{{’}_2$取值如何变化，只要$f}{’}_1 $不变，结果大小都一样，所以等高线是平行于$ f^{’}_2 $的一条直线，同理可推位$ \vec{\lambda } $下方等高线是平行于$ f^{’}_1 $的一条直线，两条直线组合成为等高线（橙色），且等高线上的个体评估值与等高线交于$ \vec{\lambda }$的点取值相同。

下面是收敛过程，上面已经讲解了等高线为什么是由两条垂直的线组成，同样可以用来说明收敛过程，在位于 $\vec{\lambda }$ 上方的个体，如果出现新的个体$ f^{’}_1 $小于等高线值，则等高线向下移动（注意两条线同时移动）；同理，位于$ \vec{\lambda } $下方的个体，如果出现新的个体$ f^{’}_2$小于等高线值，则等高线向左移动（注意两条线同时移动），直到搜索到Pareto前沿。

当我们对 $\vec{\lambda }$ 取不同值（如 $\vec{\lambda^{ '} }$ ），就可以得到其他Pareto解。

文中还提到了一个权重切比雪夫聚合方法，就是结合两种方法并加了个参数 $\rho$ 控制两种方法的比例。思想比较简单直接给公式：
$min\; g^{te}(x|\lambda,z^*)=max\; \{\lambda_i (f_i(x) - z_i^*)\}+\rho \sum_{j=1}^m(f_j(x) - z_j^*)$ $\; x\in \Omega$
Chithon的博客中提到标准Tchebycheff Approach得到的解不均匀，Yutao Qi等人于2014年提出一种解决方法(MOEA/D with Adaptive Weight Adjustment)， $\lambda^* =(\frac{\frac{1}{\lambda_1}}{\sum_{i=1}^m\frac{1}{\lambda_i}},....,\frac{\frac{1}{\lambda_m}}{\sum_{i=1}^m\frac{1}{\lambda_i}})$ 通过这个参照向量的转换即可得到分布均匀的解。

C、边界交叉聚合方法（penalty-based boundary intersection (PBI) approach）
最初的边界交叉方法给出公式如下：
$min\; g^{bi}(x|\lambda,z^*)=d$ $\; x\in \Omega$ $z^*- F\left ( x \right )=d\lambda$
给个文中的图例，其中， $\lambda,z^*$ 和上个方法切比雪夫中的定义一致（最大优化问题，只是的 $z^*$ 最大最小变了一下），约束条件$z^*- F\left ( x \right )=d\lambda $，需要保证$ F\left ( x \right ) $与$ \lambda $在同一直线上，这个限制条件不太现实，所以做出来改进。其中，$ d $为标量，表示$ F\left ( x \right ) $在$ \lambda$方向上的距离，越小表示越优。

>>> penalty-basedboundary intersection approach
基于惩罚的边界交叉方法：
$min\; g^{bip}(x|\lambda,z^*)=d_{1}+\theta d_{2}$ $\; x\in \Omega$ $d_{1}=\frac{\left |\left ( z^{*}-F\left ( x\right ) \right )^T\lambda \right |}{\left | \lambda \right |}$ $d_{2}=\left | F\left ( x \right )-\left ( z^{*} -d_{1}\lambda \right ) \right |$
作为对上一个算法的改进，改为添加惩罚函数进行处理约束。 $\theta>0$ 是一个预设参数，通常取0.5。 $d_{1}$ 为标量，表示 $F\left ( x \right )$ 在 $\lambda$ 方向上投影的距离； $d_{2}$ 为惩罚值（标量），表示 $F\left ( x \right )$ 在 $\lambda$ 方向上垂直投影的距离，偏离 $\lambda$ 越远，惩罚值越大。

在超过两个目标时，PBI方法比切比雪夫聚合方法能够获得的最优解分布更加均匀，尤其是在目标较少的情况下，这种现象更加明显。

整体框架

下面是中午原文中的算法流程图，我们按这个思路理解。

算法主要思想在于，若 $\lambda^{j}$ 与$\lambda^{j} $相邻，那么$ g^{te}\left ( x\mid \lambda ^{j},z{*} \right )$ 与 $g^{te}\left ( x\mid \lambda ^{j},z^{*} \right )$ 也应该非常相近。

算法细节上的理解
输入输出很好理解，我们直接看算法步骤 ↓

Step1：初始化
1)计算权重向量之间的欧式距离，对于每个权重向量 $\lambda ^{i}$ 得到离它最近的T个权重向量存在 $B\left ( i \right )$ （相邻集合）中，画了一个简要图，便于理解，注意 $\lambda ^{i}$ 的取值范围 $\sum_{i=1}^m\lambda_{i}=1$ (这里 $m = 2$ )，所以向量终端一定在橙线（ $y = - x + 1$ ）上，所以欧式距离越小，表示越相邻；
这里写图片描述
2)随机生成初始种群 $x^{1},\cdots ,x^{N}$ ；

3)初始化 $\vec{z^{*}}= \left ( z_{1},\cdots ,z_{m}\right )^{T}$ ， $z_{i}=min\left \{ f_{i}\left ( x^{1} \right ),f_{i}\left ( x^{2} \right ) ,\cdots f_{i}\left ( x^{N} \right )\right \}$ ,即每个目标分量上的最大值或最小值（视优化问题而定，这里是最小化优化）；

4)创建一个外部种群（EP）用于存储过程优秀个体，初始为空。

Step2：种群更新
对于每个 $i$ 都做以下操作:

1)从邻集 $B\left ( i \right )$ 中随机取两个序号 $k, l$ 利用基因重组遗传算子让 $x^{k}$ 和 $x^{l}$ 产生新解 $y$ ；

2)对 $y$ 运用基于测试你问题的修复和改进启发产生 $y^{,}$ ;

对0/1背包问题
在随机生成解得同时，我们有可能获得一个没有完全符合解约束的解，这时候需要进行修复
$min_{j\in J}\frac{g\left ( y \right )-g\left ( y^{j-} \right )}{\sum_{i\in I}^{ }w_{ij}}$
可利用上式修复， $g$ 为目标函数，如果分母影响最大同时又对分子影响最小的y存在，那么我们将这个y从解中去掉，反复循环，可知当前解符合要求。