1.项目背景
蝙蝠算法是2010年杨教授基于群体智能提出的启发式搜索算法,是一种搜索全局最优解的有效方法。该算法基于迭代优化,初始化为一组随机解,然后迭代搜寻最优解,且在最优解周围通过随机飞行产生局部新解,加强局部搜索速度。该算法具有实现简单、参数少等特点。
混合蝙蝠算法针对基本蝙蝠算法存在收敛速度慢,易陷入局部最优,求解精度低等缺陷,提出一种融合局部搜索的混合蝙蝠算法用于求解无约束优化问题。该算法利用混沌序列对蝙蝠的位置和速度进行初始化,为全局搜索的多样性奠定基础;融合Powell搜索以增强算法的局部搜索能力,加快收敛速度;使用变异策略在一定程度上避免算法陷入局部最优。
本项目通过HBA混合蝙蝠智能算法优化支持向量机分类模型。
2.数据获取
本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:
编号 | 变量名称 | 描述 |
1 | x1 | |
2 | x2 | |
3 | x3 | |
4 | x4 | |
5 | x5 | |
6 | x 6 | |
7 | x 7 | |
8 | x 8 | |
9 | y | 因变量 |
数据详情如下(部分展示):
3.数据预处理
3.1用Pandas工具查看数据
使用Pandas工具的head()方法查看前五行数据:
关键代码:
3.2数据缺失查看
使用Pandas工具的info()方法查看数据信息:
从上图可以看到,总共有9个变量,数据中无缺失值,共1000条数据。
关键代码:
3.3数据描述性统计
通过Pandas工具的describe()方法来查看数据的平均值、标准差、最小值、分位数、最大值。
关键代码如下:
4.探索性数据分析
4.1 y变量柱状图
用Matplotlib工具的plot()方法绘制柱状图:
4.2 y=1样本x1变量分布直方图
用Matplotlib工具的hist()方法绘制直方图:
4.3相关性分析
从上图中可以看到,数值越大相关性越强,正值是正相关、负值是负相关。
5.特征工程
5.1建立特征数据和标签数据
关键代码如下:
5.2数据集拆分
通过train_test_split()方法按照80%训练集、20%测试集进行划分,关键代码如下:
6.构建HBA混合蝙蝠智能算法优化支持向量机分类模型
主要使用HBA混合蝙蝠智能算法优化SVC算法,用于目标分类。
6.1算法介绍
说明:_BA算法介绍来源于网络,供参考,需要更多算法原理,请自行查找资料_。
蝙蝠算法(Bat Algorithm,BA)算法是模拟自然界中蝙蝠利用一种声呐来探测猎物、避免障碍物的随机搜索算法即模拟蝙蝠利用超声波对障碍物或猎物进行最基本的探测、定位能力并将其和优化目标功能相联系。BA算法的仿生原理将种群数量为的蝙蝠个体映射为D维问题空间中的NP个可行解,将优化过程和搜索模拟成种群蝙蝠个体移动过程和搜寻猎物利用求解问题的适应度函数值来衡量蝙蝠所处位置的优劣,将个体的优胜劣汰过程类比为优化和搜索过程中用好的可行解替代较差可行解的迭代过程。在蝙蝠搜索算法中,为了模拟蝙蝠探测猎物、避免障碍物,需假设如下三个近似的或理想化的规则:
1)所有蝙蝠利用回声定位的方法感知距离,并且它们采用一种巧妙的方式来区别猎物和背景障碍物之间的不同。
2)蝙蝠在位置xi以速度vi随机飞行,以固定的频率fmin、可变的波长λ和音量A0来搜索猎物。蝙蝠根据自身与目标的邻近程度来自动调整发射的脉冲波长(或频率)和调整脉冲发射率r属于[0,1]。
3)虽然音量的变化方式有多种但在蝙蝠算法中, 假定音量A是从一个最大值A0(整数)变化到固定最小值Amin。
对于目标函数为minf(x),目标变量为X=(x1,x2,……,xd)T的优化问题,BA算法的实施过程描述如下:
Step1: 种群初始化,即蝙蝠以随机方式在D维空间中扩散分布一组初始解。最大脉冲音量A0,最大脉冲率R0, 搜索脉冲频率范围[fmin,fmax],音量的衰减系数α,搜索频率的增强系数γ,搜索精度ε或最大迭代次数iter_max。
Step2: 随机初始化蝙蝠的位置xi,并根据适应度值得优劣寻找当前的最优解x*。
Step3: 蝙蝠的搜索脉冲频率、速度和位置更新。种群在进化过程中每一下公式进行变化:
fi=fmin+(fmax-fmin)xβ (1)
vit=vi(t-1)+(xi^t-x*)xfi (2)
xit=xi(t-1)+vi^(t) (3)
式中:β属于[0,1]是均匀分部的随机数;fi是蝙蝠i的搜索脉冲频率,fi属于[fmin,fmax];vit、vi(t-1)分别表示蝙蝠i在t和t-1时刻的速度;xit、xi(t-1)分别表示蝙蝠i在t和t-1时刻的位置; x*表示当前所有蝙蝠的最优解。
Step4:生成均匀分布随机数rand,如果rand>r,则对当前最优解进行随机扰动,产生一个新的解,并对新的解进行越界处理。
Step5:生成均匀分布随机数rand,如果rand<Ai且f(xi)<f(x*),则接受步骤4产生的新解,然后按如下公式对和进行更新:
Ai(t+1)=αAi(t) (4)
ri^(t+1)=R0[1-exp(-γt)] (5)
Step6:对所有蝙蝠的适应度值进行排序,找出当前的最优解和最优值。
Step7:重复步Step2~Step5直至满足设定的最优解条件或者达到最大迭代次数。
Step8:输出全局最优值和最优解。
从上述蝙蝠算法实现过程的式(3)~(5)可知,蝙蝠算法中的两个参数:音量的衰减系数α和搜索频率的增强系数,对算法性能的影响非常大。如何有效平衡算法的寻优精度和收敛速度,关键是合理设置参数α、γ的值。仿真过程通过反复调整参数α、γ的值,才能得到合适的参数α、γ值。
6.2 HBA混合蝙蝠算法优化算法寻找的最优参数
关键代码:
每次迭代的过程数据:
通过上图可以看出,每次迭代蝙蝠的位置数据。
最优参数:
6.3最优参数值构建模型
编号 | 模型名称 | 参数 |
1 | 支持向量机分类模型 | C=2.0300406757603744 |
2 | gamma=1.4542106511419177 |
7.模型评估
7.1评估指标及结果
评估指标主要包括准确率、查准率、查全率、F1分值等等。
从上表可以看出,F1分值为0.9154,说明模型效果比较好。
关键代码如下:
7.2查看是否过拟合
从上图可以看出,训练集和测试集分值相当,无过拟合现象。
7.3分类报告
从上图可以看出,分类为0的F1分值为0.91;分类为1的F1分值为0.92。
7.4混淆矩阵
从上图可以看出,实际为0预测不为0的 有13个样本;实际为1预测不为1的 有4个样本,整体预测准确率良好。
8.结论与展望
综上所述,本文采用了HBA混合蝙蝠智能优化算法寻找支持向量机SVC算法的最优参数值来构建分类模型,最终证明了我们提出的模型效果良好。此模型可用于日常产品的预测。
题外话
当下这个大数据时代不掌握一门编程语言怎么跟的上脚本呢?当下最火的编程语言Python前景一片光明!如果你也想跟上时代提升自己那么请看一下.
感兴趣的小伙伴,赠送全套Python学习资料,包含面试题、简历资料等具体看下方。
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python必备开发工具
工具都帮大家整理好了,安装就可直接上手!
三、最新Python学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、Python视频合集
观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
六、面试宝典
简历模板![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/e609d9de17e680ccba27f351612a0860.png)
![](https://i-blog.csdnimg.cn/blog_migrate/0ef1e3c2e532bde4d76e80b285155a8b.png)