声明:文章是从本人公众号中复制而来,因此,想最新最快了解各类智能优化算法及其改进的朋友,可关注我的公众号:强盛机器学习,不定期会有很多免费代码分享~
目录
以往大家在用KELM模型做预测的时候,常常会遇到过拟合的现象,也就是训练集精度特别高,但测试集精度很高。
因此,今天给大家带来一期利用改进沙猫群算法ISCSO优化KELM实现分类预测的代码!最关键的是,其中包含了五折交叉验证(也可以改成其他折数),能够有效避免模型过拟合,真正评估出数据的真实精度,适合作为创新点,直接替换Excel即可用!
沙猫群优化算法在计算过程中也存在着探索和开发之间的矛盾。为了使沙猫种群在搜索空间均匀分布,ISCSO算法引入了混沌映射来提高种群初始化的分布多样性,引入互利共生策略和莱维飞行策略,加强个体与最优个体之间的信息交流,扩大开采的周密性,提高算法的寻优精度和速度!
首先介绍ISCSO算法,原始沙猫群优化算法的原理这里不再过多介绍,知网上有很多,这里主要介绍改进沙猫群算法的三个改进点!
改进点1:混沌映射初始化
混沌映射具有良好的随机性、规律性和遍历性,不但能使得种群具有良好的多样性,也能使得算法在全局搜索能力、收敛速度、收敛精度上都有所提高。改进公式如下:
式中,a一般取0.4;Posid表示第i只沙猫的第d维的位置;ub和lb表示种群的搜索范围;Cid表示由式(7)产生的混沌序列。
改进点2:引入互利共生策略
沙猫群优化算法在攻击猎物时,会通过轮盘赌法随机选择角度来靠近猎物进行攻击。但这样的攻击方式随机性较大,也易于陷入局部最优,互利共生策略通过加强个体与最优个体的信息交流,可以消除沙猫攻击猎物时的消极影响,提高沙猫的寻优精度和收敛速度。改进公式如下:
式中,Posnew为更新后的位置;Posbc为最优个体的位置;Posrnd为随机个体的位置;bf表示利益因子,随机选择1或2,表示可能部分受益或全部受益;RMV表示最优个体与随机个体的信息交流。
改进点3:引入莱维飞行策略
沙猫群优化算法在搜索猎物和攻击猎物时,都是通过随机角度进行的,导致算法会遗漏部分较优的解,降低收敛精度。为了增强搜索的周密性,消除局部最优解的消极影响,本算法引入莱维飞行策略,既加强了算法的局部搜索能力,又能保证算法在全局搜索时具有良好的周密性。改进公式如下:
式中,Posnew为更新后的个体位置;Posbc表示最优个体的位置;PosLevy表示莱维飞行位置;l是(0,1)的随机数;Posrnd表示随机个体的位置;μ是服从μ~N(0,σ2μ)的随机数,其中Γ为伽马函数,β为(0,2)的随机数。
数据格式
作者这里采用了传统的机器学习分类数据集,没有实际含义,12个特征,357个样本,四分类,如下图所示。
如果大家想要做故障诊断等应用,都是完全没有问题的!
如果想要更换自己的数据,只需最后一列放类别(类别从1开始),其余列放特征即可,无需更改代码,非常方便!
结果展示
预测结果图:
混淆矩阵图:
迭代曲线图:
可以看到,训练集与测试集预测效果非常接近,证明其有效防止了过拟合的发生!
部分代码展示
%% 读取数据
res = xlsread('数据集.xlsx');
%% 分析数据
num_class = length(unique(res(:, end))); % 类别数(Excel最后一列放类别)
num_res = size(res, 1); % 样本数(每一行,是一个样本)
num_size = 0.7; % 训练集占数据集的比例
res = res(randperm(num_res), :); % 打乱数据集(不打乱数据时,注释该行)
flag_conusion = 1; % 标志位为1,打开混淆矩阵(要求2018版本及以上)
%% 设置变量存储数据
P_train = []; P_test = [];
T_train = []; T_test = [];
%% 划分数据集
for i = 1 : num_class
mid_res = res((res(:, end) == i), :); % 循环取出不同类别的样本
mid_size = size(mid_res, 1); % 得到不同类别样本个数
mid_tiran = round(num_size * mid_size); % 得到该类别的训练样本个数
P_train = [P_train; mid_res(1: mid_tiran, 1: end - 1)]; % 训练集输入
T_train = [T_train; mid_res(1: mid_tiran, end)]; % 训练集输出
P_test = [P_test; mid_res(mid_tiran + 1: end, 1: end - 1)]; % 测试集输入
T_test = [T_test; mid_res(mid_tiran + 1: end, end)]; % 测试集输出
end
%% 数据转置
P_train = P_train'; P_test = P_test';
T_train = T_train'; T_test = T_test';
%% 得到训练集和测试样本个数
M = size(P_train, 2);
N = size(P_test , 2);
%% 数据归一化
[p_train, ps_input] = mapminmax(P_train, 0, 1);
p_test = mapminmax('apply', P_test, ps_input );
t_train = ind2vec(T_train);
t_test = ind2vec(T_test );
%% 参数设置
pop = 10; % 种群数量
Max_time = 50; % 设定最大迭代次数
Kernel_type = 'rbf'; % 核函数
dim = 2; % 维度为2,即优化两个参数,正则化系数 C 和核函数参数 S
lb = [1, 1]; % 下边界
ub = [100, 100]; % 上边界
fobj = @(x) fun(x, p_train, T_train);
[Best_score, Best_pos, Curve] = ISCSO(pop, Max_time, lb, ub, dim, fobj); %开始优化
参考文献
[1]贾鹤鸣,李永超,游进华,等.改进沙猫群优化算法的机器人路径规划[J].福建工程学院学报,2023,21(01):72-77.
完整代码获取
点击下方小卡片,再后台回复关键词:
FLYCA
其他更多需求或想要的代码均可点击下方小卡片,再后台私信,看到后会秒回~
更多代码链接:更多代码链接