具有动态自适应学习机制的教与学优化算法

一、理论基础

1、教与学优化算法

请参考这里

2、动态自适应教与学优化算法

(1)动态自适应学习

将“教”阶段的位置更新公式修改成为式(1),学生的原状态按比例向新状态进行转换,公式如下: X i ′ ( t ) = δ × X i ( t ) + r a n d ( 0 , 1 ) × ( X t ( t ) − β × X m ( t ) ) (1) X'_i(t)=\delta×X_i(t)+rand(0,1)×(X_t(t)-\beta×X_m(t))\tag{1} Xi(t)=δ×Xi(t)+rand(0,1)×(Xt(t)β×Xm(t))(1)其中, δ = 1 / ( 1 + exp ⁡ ( k × ( T − 2 × t ) / T ) ) ∈ ( 0 , 1 ) \delta=1/(1+\exp(k×(T-2×t)/T))\in(0,1) δ=1/(1+exp(k×(T2×t)/T))(0,1)是一个自适应非线性因子, T T T为预设最大迭代次数, t t t为当前迭代次数, k k k为变化速率。容易看出,在算法迭代早期,种群主要向教师个体学习,可以快速向最优个体周围靠拢.而随着迭代的进行 δ \delta δ逐渐增大,个体维持自身状态能力增强,减缓了向最优个体靠近的速度,避免过早的聚集于教师周围。而这种机制也与生活中学生的学习行为一致,在早期学生能力较差时,主要向教师学习,快速提升班级的平均分。后期学生状态提升之后,学生会有选择的吸收教师传授的知识,保持自己状态的能力增强。

(2)教师的动态随机搜索

为了提高算法的精度,在算法后期(本文为预设迭代次数的2/3后开始)引入教师个体执行动态随机搜索(Dynamic Random Search, DRS)。
DRS算法步骤如下:

输入: 个体X, 迭代次数M
输出: 个体X
步骤1 初始化步长d
步骤2 生成向量X'∈[-d,d] 
步骤4 生成向量 X1=X+X'和X2=X-X' 
步骤5 选择 X1,X2,X 中优者作为 X 
步骤6 调整步长d
步骤7 迭代没有结束则转, 步骤2; 否则输出X, 结束算法

(3)算法实现

动态自适应教与学优化算法(Dynamic Self-adapting Learning TLBO, SLTLBO)算法步骤如下:
在这里插入图片描述

二、仿真实验与分析

将DSLTLBO算法分别与DE、TLBO进行对比,设置种群规模为30,最大迭代次数为500,每个算法独立运行30次,以文献[1]中的F1、F4、F5、F7、F9、F10为例,F9为2维,其余均为30维。
结果显示如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

函数:F1
DE:平均值:0.00022807,标准差:0.00012011,最差值: 0.00072521,最优值:0.00010925
TLBO:平均值:3.26e-83,标准差:6.8668e-83,最差值: 3.3958e-82,最优值:1.5029e-85
DSLTLBO:平均值:0,标准差:0,最差值: 0,最优值:0
函数:F4
DE:平均值:165.5618,标准差:43.3656,最差值: 263.1405,最优值:50.0132
TLBO:平均值:24.6542,标准差:0.59487,最差值: 25.9268,最优值:23.22
DSLTLBO:平均值:25.9989,标准差:0.58726,最差值: 27.7658,最优值:24.9899
函数:F5
DE:平均值:0.0045841,标准差:0.0077149,最差值: 0.031694,最优值:0.00037177
TLBO:平均值:0,标准差:0,最差值: 0,最优值:0
DSLTLBO:平均值:0,标准差:0,最差值: 0,最优值:0
函数:F7
DE:平均值:32028.4572,标准差:4835.5427,最差值: 39584.3937,最优值:21203.0938
TLBO:平均值:1.0555e-17,标准差:2.5e-17,最差值: 1.3019e-16,最优值:4.0976e-21
DSLTLBO:平均值:6.9416e-321,标准差:0,最差值: 2.0787e-319,最优值:0
函数:F9
DE:平均值:-1.0316,标准差:6.7752e-16,最差值: -1.0316,最优值:-1.0316
TLBO:平均值:-1.0316,标准差:6.7752e-16,最差值: -1.0316,最优值:-1.0316
DSLTLBO:平均值:-1.0316,标准差:6.7122e-16,最差值: -1.0316,最优值:-1.0316
函数:F10
DE:平均值:0.3541,标准差:0.02903,最差值: 0.41504,最优值:0.31216
TLBO:平均值:0.016203,标准差:0.0118,最差值: 0.037224,最优值:0.0097159
DSLTLBO:平均值:0.0097159,标准差:1.8507e-09,最差值: 0.0097159,最优值:0.0097159

实验表明,本文提出的DSLTLBO算法具有较好的收敛速度和求解精度。

三、参考文献

[1] 李丽荣, 李木子, 李崔灿, 等. 具有动态自适应学习机制的教与学优化算法[J]. 计算机工程与应用, 2020, 56(19): 62-67.

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

心️升明月

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值