大猩猩部队优化算法（Gorilla Troops Optimizer，GTO）

鹤鸣优化

已于 2023-03-25 14:37:39 修改

阅读量2.3k

点赞数 4

分类专栏：元启发式优化算法文章标签：算法机器学习 python matlab 启发式算法

于 2023-03-07 09:00:00 首次发布

原文链接：https://doi.org/10.1002/int.22535

版权

元启发式优化算法专栏收录该内容

19 篇文章

订阅专栏

大猩猩部队优化算法(GTO)是一种基于大猩猩社会行为的元启发式算法，通过初始化、探索阶段和开发阶段来优化问题。在探索阶段，算法模拟大猩猩的迁移行为以遍历解决方案空间，而在开发阶段，通过跟随银背大猩猩和成年女性竞争的行为进行进一步优化。实验结果显示，GTO在多个测试函数上展现出良好的收敛性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、算法灵感

大猩猩部队优化算法(Gorilla Troops Optimizer, GTO)是于2021年提出的元启发式算法，其灵感来自于大猩猩在自然界中的社会行为。将大猩猩的集体社会生活习性数学化，从而提出了具体的数学模型。

二、算法介绍

2. 1 初始化

在GTO的初始化过程中会先设置相应的参数：种群数量 $N$ 、最大迭代次数 $M a x I t$ 、 $β$ 、 $p$ 、 $w$ 。然后在探索空间中随机初始化种群。其中， $p$ 是在 $0$ 到 $1$ 之间的参数，控制大猩猩对未知位置的迁移策略。 $β$ 为计算大猩猩暴力程度公式中的参数，其值为 $0.3$ 。 $w$ 是开发阶段的两种机制的控制参数，其值为 $0.8$ 。

2. 2 探索阶段

大猩猩们在银背大猩猩的领导下以群体的形式生活在自然中,在探索阶段文章设计了三种机制，分别是迁移到未知位置，迁移到已知位置以及迁移到其他大猩猩的位置。这些机制使GTO算法拥有了出色的空间探索能力，第一种机制的执行条件是 $rand_1<p$ ，它能够使大猩猩随机探索空间，第二种机制用于提升GTO对空间的探索程度，它的执行条件是 $rand_2≥0.5$ ；最后，当 $rand_2<0.5$ 时，执行第三种机制，用于增强了GTO逃离局部最优点的能力。具体的模拟公式如下：
$\left\{ \begin{aligned} &(UB - LB) \times {r_1} + LB\qquad\qquad\qquad\qquad\qquad\qquad\qquad\quad\ ,rand_1 < p \cr &({r_2} - C) \times {X_r}(t) + L \times H\qquad\qquad\qquad\qquad\qquad\qquad\qquad,rand_2 \ge 0.5\ and\ rand_1 \ge p \cr &X(t) - L \times (L \times (X(t) - GX(t))) + {r_3} \times (X(t) - G{X_r}(t)),rand_2 < 0.5\ and\ rand_1 \ge p \cr \end{aligned} \right. \tag{1}$ 其中， $GX (t + 1)$ 表示大猩猩下一次迭代时的位置， $X (t)$ 表示当前大猩猩的位置。 $r_1$ 、 $r_2$ 、 $r_3$ 和 $r an d$ 都表示 $0$ 到 $1$ 之间的随机数。变量的上下界分别表示为 $U B$ 、 $L B$ 。 $X_r$ 和 $GX_r$ 都是随机选取的大猩猩的位置。 $t$ 表示当前的迭代次数。在初始阶段的时候 $C$ 的值的变化会较大，在后期变化值的变化会逐渐减少，其用公式(2)计算。 $L$ 是用来模拟银背大猩猩的领导才能，其用公式(4)计算。银背大猩猩会由于经验的不足而导致寻找食物或者管理群体的决策错误。 $Z$ 是区间 $[- C, C]$ 内的一个随机数，其用公式(6)计算。
$\times \left( {1 - {t \over {MaxIt}}} \right) \tag{2}$ $\cos (2 \times {r_4}) + 1 \tag{3}$ 其中， $r_4$ 是在 $[- 1, 1]$ 之间的一个随机数
$\times l \tag{4}$ 其中， $l$ 是 $0$ 到 $1$ 之间的随机数
$\times X(t) \tag{5}$ $\left[ { - C,C} \right] \tag{6}$ 在探索阶段结束时，要分别计算 $GX$ 和 $X$ 的适应度值。如果 $GX (t)$ 的适应度值小于 $X (t)$ 的适应度值，则 $X (t)$ 的位置将被 $GX (t)$ 的位置替代。

2. 3 开发阶段

在GTO算法的开发阶段，模拟了大猩猩的两种行为：跟随银背和成年女性竞争。这两种行为是通过 $C$ 进行切换的，当 $C \geq w$ 时，选择跟随银背大猩猩，相反则进行竞争。跟随银背大猩猩机制的具体公式如下：
$\left\{ \begin{aligned} &GX(t + 1) = L \times M \times (X(t) - {X_{silverback}}) + X(t) \cr &M = {\left( {{{\left| {{1 \over N}\sum\limits_{i = 1}^N {G{X_i}(t)} } \right|}^g}} \right)^{{1 \over g}}} \cr &g = {2^L} \cr \end{aligned} \right. \tag{7}$ 这里的 $X_{Silverback}$ 代表着最优解， $GX_i(t)$ 是指迭代时每只候选大猩猩的位置， $N$ 表示大猩猩的总数。
成年女性竞争机制的计算公式如下：
$\left\{ \begin{aligned} &GX(t) = {X_{silverback}} - ({X_{silverback}} \times Q - X(t) \times Q) \times A \cr &Q = 2 \times {r_5} - 1 \cr &A = \beta \times E \cr &E = \left\{ \begin{aligned} {N_1}, {rand \ge 0.5} \cr {N_2},{rand < 0.5} \cr \end{aligned} \right. \end{aligned} \right. \tag{8}$ 其中， $Q$ 是模拟大猩猩竞争强度， $r_5$ 是介于 $0$ 和 $1$ 之间的随机数。 $A$ 是用来模拟竞争程度的系数， $β$ 是进行优化操作前设定的参数。 $E$ 用来模拟暴力对解决方案维度的影响。 $r an d$ 是0到1之间的随机数，当 $r an d \geq 0.5$ ， $E$ 会等于正态分布和问题维度中的随机值；反之， $E$ 会等于正态分布中的随机数。

2. 4 算法伪代码

设置参数:种群的数量 $N$ 、最大的迭代次数 $M a x I t$ 、 $β$ 、 $p$ 、 $w$
随机初始化每个种群个体 $X_i(i=1,2,...,N)$
计算每一个大猩猩个体的适应度值
While $t \leq M a x I t$ do
更新计算 $C$ 、 $L$ 的值
For $i = 1$ to $N$ do
用公式(1)更新当前位置大猩猩
End
计算大猩猩个体的适应度值，如果 $GX$ 的适应度值比 $X$ 的适应度值好，则进行替换，同时更新银背大猩猩的位置(最好个体位置)。
For $i = 1$ to $N$ do
If $∣ C ∣ \geq w$ then
使用公式(7)进行更新
Else
使用公式(8)进行更新
End If
End For
计算大猩猩个体的适应度值，如果 $GX$ 的适应度值比 $X$ 的适应度值好，则进行替换，同时更新银背大猩猩的位置(最好个体位置)。
$t = t + 1$
End While
返回最优适应度值和最优的大猩猩个体。

三、实验结果

GTO在23个经典测试函数(设置维度 $d im = 30$ )的F5、F6、F7中的收敛曲线，测试函数公式如下：

函数	公式	理论值
F5	${F_5}(x) = \sum\nolimits_{i = 1}^{d - 1} {[100{{({x_{i + 1}} - x_i^2)}^2} + {{({x_i} - 1)}^2}]}$	$0.00$
F6	${F_6}(x) = {\sum\nolimits_{i = 1}^d {({x_i} + 5)} ^2}$	$0.00$
F7	${F_7}(x) = \sum\nolimits_{i = 1}^d {i \times x_i^4 + random[0,1)}$	$0.00$