通过多种综合性学习增强勘探开发的粒子群优化（HCLPSO）-CSDN博客

本文链接：https://blog.csdn.net/weixin_38022166/article/details/100672695

HCLPSO：Heterogeneous comprehensive learning particle swarm optimization

with enhanced exploration and exploitation

原文：https://www.sciencedirect.com/science/article/pii/S2210650215000401

1.摘要

本文提出了一种具有较强探索性和开发性的综合学习粒子群优化算法，称为“多种类综合学习粒子群优化算法”。 “”(HCLPSO)，该算法将群体划分为两个子种群。每个子种群都被指定只专注于勘探或开发。综合学习(CL)策略被用来生成两个子群体的样本。在勘探亚种群中，样本是通过使用勘探亚种群本身中粒子的个人最佳经验来生成的。在开发-亚群中，使用整个群群体的个人最佳经验来生成样本。因为勘探-亚群并不从开发-亚群中的任何粒子中学习，即使开发子种群过早收敛，也能保持勘探子种群的多样性。

2.介绍

为了解决多模态、不连续、非凸和不可微优化问题，研究人员开发了基于种群的算法：such as particle swarm optimization (PSO), genetic algorithm (GA), differential evolution (DE), evolutionary strategy (ES), evolutionary programming (EP) and so on。在基于种群的算法中，寻找问题的最优解是基于两个基石，即：全局搜索，在搜索空间内进行搜索，寻找有前途的区域。局部搜索，利用所识别的有希望的区域来微调搜索以寻找最优解。当发现勘探和开采过程之间的适当平衡时，可以获得基于人口的算法的良好收敛行为。强调勘探将导致在搜索空间的下部区域上搜索时间的浪费，并减缓收敛速度。另一方面，强调开发将导致在搜索过程的早期就会丢失多样性，从而可能陷入局部最优状态。因此，在以种群为基础的进化算法中，在搜索空间的探索和开发之间取得平衡是非常重要的。

W惯性权重提出为了解决：如果全局最佳点位于局部最小值附近，则很难逃离局部最优，而PSO在局部最小值附近会遭受多样性损失。

收缩系数的控制参数X：以控制粒子群的收敛趋势，包括勘探和开发能力。

邻域拓扑还根据群粒子间的信息共享控制PSO的勘探开发能力。

Liang提出了综合学习粒子群优化器(CLPSO)，而不是利用邻域拓扑来学习来自其他粒子的信息，在这些粒子群优化器(CLPSO)中，每个粒子从其他粒子中学习。

OLPSO：正交学习策略是将粒子自身的最佳体验(认知学习)与邻域最佳体验(社会学习)结合起来学习的一种正交学习策略。

一种散射学习粒子群优化算法(SLPSOA)。

开发了一种竞争群优化器(CSO)，在更新粒子位置时既不涉及个人最佳位置，也不涉及全局最佳位置。

为了解决勘探开发的权衡问题，提出了多种类的粒子群算法heterogeneous PSO (HPSO)。允许各类群中的粒子的行为池中遵循不同的速度和位置更新规则，从而具有在整个问题搜索空间中探索和开发的能力。通过这些方法，本文提出一个具有两个子种群的CLPSO称为异构CLPSO(HCLPSO)。本文不依赖于单一的方法来平衡粒子群算法的勘探和开发能力，而是通过以下几种方法来解决这一问题：通过使用自适应控制参数，通过控制粒子间的信息共享(或拓扑)，采用学习策略，使用异构群而不是同质。

在本文中，采用了一个异构群，将该群划分为两个子种群。每个子种群被分配分别进行勘探和开采搜索。勘探和开发过程得到加强，并且勘探和开发没有进行相互削弱。在粒子群算法中，学习两个样本为个人最佳和整个群体的最佳，会导致两个问题。一种是“振荡现象”，就会发生这种现象，即两种方向是相反的，这就降低了算法的搜索能力和收敛速度。另一种是“两步一退现象”。这会使求解向量在某些维度上得到改进，而在其他维度上则会下降，因为一个样本在某些维度上可能具有良好的值，而另一些维度上则可能具有良好的值。因此，为了从群中不同粒子的不同维数中提取这些有用的信息，使用综合学习策略（CL）生成一个有前途的样本。

综合学习策略（CL）勘探子种群群体从其成员以前的最佳经验中学习不同维度的知识，其粒子具有较高的勘探能力。开发-亚群体的好处是从群体中所有粒子的最佳经验中学习，包括整个群体的最佳经验，因此，它的粒子具有很强的开发能力。对于群中的每个粒子，指定了不同的学习概率值，使得来自勘探子种群的粒子不受开发子种群的影响。通过这种方式，粒子之间的信息共享得到了控制，同时，开发- 亚群体能够立即开发勘探亚群体发现的新的良好区域。此外，在子种群中采用自适应控制参数来加强勘探和开发。因此，这种新的非均匀子种群结构能够同时强调勘探和开发，而不受一个过程的不利影响。

3.异构综合学习粒子群算法在强化探索与开发中的应用

为了减少勘探开发对彼此的不利影响，将群种群划分为两个子种群，一个子种群进行勘探开发，分别。为了确定每个子种群中粒子的样本，选择了综合学习(CL)策略。在CLPSO算法中，种群中的每一个粒子都能够从所有其他粒子的不同维度中学习到最好的经验，而不是单独跟随最好的个体。此外，还可以通过学习概率曲线来确定粒子的探测和开发水平。因此，在算法中选择CL策略，为探索和开发子群体中的粒子生成样本。

3.1综合学习粒子群优化器（超过m代不更新pbest就用这个来初始化pbest）

粒子的飞行方向是由原粒子群中的粒子群( $pbest_{i}^{d}$ )和(gbest)来引导的。然而，gbest可能远离全局最优，表示多模态问题中的不好的局部最优解。在CLPSO中，粒子的速度是用所有粒子的pbest来更新的。粒子的每个维度都从不同粒子的pbest学习。而不是向所有维度的同一个样本学习。这增强了人口的多样性。

指示每个维度d的第i粒子是否遵循它自己的或其他人的 $pbest_{i}^{d}$ 。根据学习概率PCi值（不同粒子的不同pc值）决定每个维度的样本，探索性个体和开发个体是根据这些学习概率值指定的。

ps表示种群大小。a=0.05，b=0.45，定义了粒子i应该采用哪个粒子的pbest,可以是任何粒子的pbest所对应的维度,由概率Pc决定，也被叫做学习概率。对于粒子i的任何一个维度，都随机生成一个随机数。如果这个数字大于Pc，相应的维度就会从自身的pbest学习。否则，将会从其他的粒子的pbest学习。

该位置由大小为2的竞赛选择决定，随机选取两个个体，选择适合度较好的粒子作为相应的尺寸。因此，模型 $pbest_{fi(d))}$ 是一个新的方向，每个维度都从几个粒子中的最佳粒子学习。为了保证粒子的运动改善其最佳状态，在CLPSO中，一定数量的评估被定义为刷新间隙m，如果连续M个动作没有改进（自己的pbest没有更新），则将生成一个新的 $pbest_{fi(d))}$ 。如果粒子的更新位置超出了约束范围，则不更新粒子的适应度值及其最佳值。

3.2具有强化勘探和开发的异构CLPSO

通过随机数与学习概率Pc曲线的比较，确定样本选择。不同的Pc值，颗粒具有不同的勘探开发能力。然而，高勘探（pbset）倾向的颗粒会受到开采（gbest）倾向较高的颗粒的不利影响【】。因此，为了解决这一问题，平衡勘探和开采搜索，采用了勘探子种群和开发子种群对CLPSO进行了增强。本文提出了一种异构CLPSO(HCLPSO)算法。在HCLPSO中，将群划分为两个不同的子种群。第一子种群为勘探目的增强，第二亚群体为开发目的增强。在两次探险中勘探和开发子群体中，使用学习概率pc曲线的综合学习(CL)策略生成样本，如下图：

利用方程（7）更新了勘探增强子种群的速度。利用以下公式更新开发速度-增强的亚群体：

在子种群1中，方程采用时变加速度系数c1-3-1.5为加强勘探，在子种群2中，Eq采用时变加速度系数c1-2.5-0.5和c2-0.5~2.5加强开采

两个子群体中的所有粒子都是由综合学习(CL)策略得到的样本来引导的，为粒子的每个维生成随机数，并与其各自的学习概率PCI值进行比较。根据图1所示的学习概率Pc曲线，亚群体1的学习概率值较低，接近于零（维度大部分从自身的pbest学习）。如果为粒子的每个维生成随机数将其与低学习概率值进行比较，发现第1亚群体中的粒子在大部分维度中主要是从其自身的pbest中学习。如果一个粒子的所有维都是它自己的pbest，我们将随机选择一个维度向第1组（亚群体1）中另一个粒子的对应维数学习。

与亚群体组1不同的是，子种群组2中的粒子不仅从使用CL策略生成的样本中学习，也从种群的gbest中学习。因此，亚群体2具有较强的开发利用能力。如果粒子是从他们自己的pbest和gbest学习，它有更可能被困在局部区域。为了避免这种情况，粒子将采用其他粒子的pbest (25%)如图1。同时如果一个粒子的所有范例都是它自己的pbest，我们会随机选择其中的一维去学习另一个粒子的对应该维的pbest。

由于探测粒子不允许访问开发粒子的信息，没有从开发子种群到勘探子种群的信息流。因此，避免了信息的快速流动，即使开发子种群过早收敛，勘探小组有可能从局部最优中拯救开发群体的导向【开发的进入了局部最优】。因此，本文提出的HCLPSO算法实现了勘探与开采的折衷。与CLPSO一样，如果刷新代数 m(迭代次数)没有任何改进的话（自己的pbest没有更新），第1亚群体将通过向自己所拥有的个体进行学习，第2亚群体将向整个种群中的个体进行学习，产生一种新的 $pbest_{fi(d))}$ 。

群体多样性可以用来识别种群是在进行勘探还是开发。

因此，本文研究了单个单峰函数(移位球函数)各子种群和整体种群的多样性。在30维上有一个多模态函数(移位旋转Griewank函数)，对种群的多样性进行了测量：