论文解读：DBSCAN-Based Multi-Objective Niching to Approximate Equivalent Pareto-Subsets

yanleusstedu

于 2021-06-04 14:57:21 发布

阅读量482

点赞数

分类专栏： EC 文章标签：算法聚类

本文链接：https://blog.csdn.net/yanle_usstedu/article/details/117434942

版权

EC 专栏收录该内容

20 篇文章 5 订阅

订阅专栏

ABSTRACT
INTRODUCTION
RAKE SELECTION
CLUSTERING WITH DBSCAN
CLUSTERING-BASED NICHING
REFERENCES

ABSTRACT

This paper introduces a niching method that approximates Pareto-optimal solutions with diversity mechanisms in objective and decision space. The rake selection is used for diversity in objective space , a selection method based on the distances to reference lines in objective space. A niching approach that uses the density-based clustering method DBSCAN is introduced for diversity in decision space.

INTRODUCTION

The optimization of conflictive objectives belongs to one of the most challenging tasks in optimization. This paper will concentrate on the detection and approximation of equivalent Pareto-subsets.
Most multi-objective algorithms that have been proposed in the past concentrate on diversity in objective space. Only a few approaches also consider diversity in decision space. Ih this paper, the niching technique maintains diversity in objective space with rake selection, and diversity in decision space with the clustering approach.

RAKE SELECTION

在这里插入图片描述
借助于目标空间中任意分布的参考线——耙（rake），Rake-Selection 已经被用于近似帕累托前沿（面）。如 $F i g u r e 2$ 所示。
首先需要在决策空间中定义 $k$ 条参考线 $r_{j}$ ， $\leq j \leq k$ 。原则上可以任意分布，考虑二目标情况，通常设置一组均匀分布的平行线。均匀分布的参考线将带来帕累托前沿上均匀分布的解。这里，将耙正交且等距排列在由帕累托最优拐角点 $c_i$ ， $\leq i \leq m$ 定义的 $(m - 1)$ 维超平面上，这将会在目标空间中产生 $k^{m-1}$ 条参考线。拐角点的求法（略）。为了定义每个耙 $r_j$ ，必须计算一个与拐角点 $c_i$ 的超平面 $h$ 正交的向量 $n$ ——耙基（rake base）。由于截断点的等距分布，参考线在目标空间中是均匀且平行分布的。其中截断点定义了参考线的位置：
$p_i = c_1 + (i -1) \cdot ||c_1 - c_2||/(k - 1), 1 \leq i \leq k$
此外，可通过Gram-Schmidt正交法计算一个方向向量 $n$ ，用来保证每条参考线都与耙基正交。
$A l g o r i t h m 1$ 给出了Rake选择的具体过程：
在这里插入图片描述
Rake选择算法的第一步是对合并（父子）种群执行非支配排序。然后对产生的非支配解集 $\eta$ 实施Rake选择操作。原理是：从 $\eta$ 中选择距离每条参考线最近的解用于生成新种群。由于不同的参考线可能对应同一个解，被选中的解数目 $\delta$ 小于种群规模 $\mu$ 时，按照非支配排序序号最小的原则取 $\mu-\delta$ 个解来填充种群。

CLUSTERING WITH DBSCAN

本节介绍一种基于密度的聚类方法（DBSCAN）。
相比K-Means，DBSCAN在形成小生境的过程中具有两个优势：1，无需提前设定类别数；2，允许样本数据可以是非凸的，交织的（如下图）。
在这里插入图片描述
一项重要任务是寻找核心点。为此，首先定义特征向量 $x$ 的 $\varepsilon$ 邻域， $\varepsilon-neighborhood~N_\varepsilon(x)$ ，这里令 $\eta$ 为数据元素集， $\varepsilon$ 和 $\nu$ 分别为邻域半径以及最少邻居数，则：
$N_\varepsilon = {y\in \eta | ||y-x||\leq \varepsilon}$
对于核心点的定义为：
$N_\varepsilon | \geq \nu$
否则为边界点。
在展示完整DBSCAN之前，需要知道几个重要定义：

直接密度可达（Direct Density-Reachable）
概念 : 样本 $p$ 是核心对象, 样本 $q$ 在其 $\varepsilon$ -邻域中 , 那么称为 $p$ 直接密度可达 $q$ ；注意方向 $\rightarrow q$ ，即从 $p$ 出发直接密度可达 $q$ ；
直接密度可达有两个条件 : ① 起点必须是核心对象 , ② 终点必须在起点的 $\varepsilon$ -邻域中；
密度可达（Density-Reachable）
存在一个由核心对象 $p_1, \cdots, p_{n}$ 组成的链， $p$ 直接密度可达 $p_1$ ， $p_1$ 直接密度可达 $p_2$ ， $\cdots$ ， $p_{n-1}$ 直接密度可达 $p_{n}$ ，而且 $p_{n}$ 直接密度可达 $q$ ，此时称 $p$ 密度可达 $q$ 。
链上的核心对象要求 : 链的起点和经过的点必须是核心对象, 链的最后一个点, 可以是任意对象。
例如：核心点 $p$ 直接密度可达核心点 $q$ ，核心点 $q$ 直接密度可达任意一点 $t$ ，那么 $p$ 密度可达 $t$ 。
密度连接
$p$ 和 $q$ 两个样本, 存在一个中间样本对象 $O$ ， $O$ 到 $p$ 是密度可达的， $O$ 到 $q$ 也是密度可达的，此时称 $p$ 和 $q$ 可由 $O$ 密度连接。
$O$ 可以密度连接 $p$ 和 $q$ 样本 , 但是 $p$ 和 $q$ 不一定能走到 $O$ ，它们可能不是核心对象。
注意， $O$ 以及到样本 $p$ 或 $q$ 中间的样本都必须是核心对象。

（图片原文链接：https://blog.csdn.net/shulianghan/article/details/105927658）

接下来介绍DBSCAN的完整算法
在这里插入图片描述

CLUSTERING-BASED NICHING

本节中提到了两种基于聚类的小生境方法：

Single Population Niching and Adaptive Corner Points
该实例中使用了 $k - m e a n s$ 聚类方法用以生成小生境
Multiple Population and Recluster Indicator
此例中，使用DBSCAN来形成小生境，同时分析了多种群在算法中的应用。
每个子种群都采用 $(\mu, \lambda)$ 方案。因此规模越大的子种群找到新小生境的概率就越更高。
本文给出了一个重聚类指标的定义，用来自动识别潜在的小生境：

完整算法如下：

重聚类指标的思想是基于目标空间中一个小生境的两个相邻个体在决策空间中相邻的假设。因此，如果目标空间中相邻解x和y的距离 $f(x)-f(y)||_2$ 在决策空间中高于目标空间中更不相似的两个解的距离，那么可能已经发现了一个新的小生境。
如果重聚类条件成立，则必须检查新的小生境。此时要重启DBSCAN来进行聚类。

REFERENCES

[1]. https://www.researchgate.net/publication/220739961_DBSCAN-based_multi-objective_niching_to_approximate_equivalent_pareto-subsets
[2]. https://www.researchgate.net/publication/221653977_A_Density-Based_Algorithm_for_Discovering_Clusters_in_Large_Spatial_Databases_with_Noise
[3]. https://link.springer.com/chapter/10.1007/978-3-642-04617-9_23

yanleusstedu

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
论文解读：DBSCAN-Based Multi-Objective Niching to Approximate Equivalent Pareto-Subsets

DBSCAN-Based Multi-Objective Niching to Approximate Equivalent Pareto-SubsetsABSTRACTINTRODUCTIONRACK SELECTIONCLUSTERING WITH DBSCANCLUSTERING-BASED NICHINGSingle Populaion Niching and Adaptive Corner PointsMultiple Population and Recluster IndicatorSUMMA
复制链接

扫一扫

专栏目录