GA相关基础知识
(1)遗传算法的应用
函数优化(遗传算法的经典应用领域);组合优化(实践证明,遗传算法对于组合优化中的NP完全问题,如0-1背包问题,TSP等,非常有效);自动控制;机器人智能控制;组合图像处理和模式识别;人工生命;遗传程序设计;
(2)遗传学基本概念与术语
基因型(genotype):性状染色体的内部表现;
表现型(phenotype):染色体决定性状的外部表现,或者说,根据基因型形成的个体;
进化(evolution):逐渐适应生存环境,品质不断得到改良。生物的进化是以种群的形式进行的。
适应度(fitness):度量某个物种对于生存环境的适应程度。
选择(selection):以一定的概率从种群中选择若干个个体。一般,选择过程是一种基于适应度的优胜劣汰的过程。
复制(reproduction):细胞分裂时,遗传物质DNA通过复制而转移到新产生的细胞中,新细胞就继承了旧细胞的基因。
交叉(crossover):两个染色体的某一相同位置处DNA被切断,前后两串分别交叉组合形成两个新的染色体。也称基因重组或杂交;
变异(mutation):复制时可能(很小的概率)产生某些复制差错,变异产生新的染色体,表现出新的性状。
编码(coding):DNA中遗传信息在一个长链上按一定的模式排列。遗传编码可看作从表现型到基因型的映射。
解码(decoding):基因型到表现型的映射。
个体(individual):指染色体带有特征的实体;
种群(population):个体的集合,该集合内个体数称为种群的大小;
(3)基本思路
(4)简单的例子
①产生初始种群
②计算适应度
③选择,即计算对应的选择概率、累计概率
④交叉
⑤变异
⑥至下一代,循环直到满足终止条件
(5)简单实践
①编码
表现型:x
基因型:二进制编码(串长取决于求解精度)
串长与精度之间的关系:
若要求求解精度到6位小数,区间长度为2-(-1)=3,即需将区间分为3/0.000001=3×106等份。所以编码的二进制串长应为22位
②产生初始种群
产生的方式:随机
产生的结果:长度为22的二进制串
产生的数量:种群的大小(规模),如30,50,…
1111010011100001011000
1100110011101010101110
1010100011110010000100
③计算适应度
不同的问题有不同的适应度计算方法
本例:直接用目标函数作为适应度函数
①将某个体转化为[-1,2]区间的实数:
s=<1000101110110101000111> → x=0.637197
②计算x的函数值(适应度):
f(x)=xsin(10πx)+2.0=2.586345
(0000000000000000000000)→-1
(1111111111111111111111)→2
上面的①其实就是二进制与十进制之间的转换:
第一步,将一个二进制串(b21b20…b0)转化为10进制数:
第二步,x’对应的区间[-1,2]内的实数
④遗传操作
选择:轮盘赌选择法;
交叉:单点交叉;
变异:小概率变异
(6)注意事项
编码原则
完备性(completeness):问题空间的所有解都能表示为所设计的基因型;
健全性(soundness):任何一个基因型都对应于一个可能解;
非冗余性(non-redundancy):问题空间和表达空间一一对应。
适应度函数的重要性
适应度函数的选取直接影响遗传算法的收敛速度以及能否找到最优解。
一般而言,适应度函数是由目标函数变换而成的,对目标函数值域的某种映射变换称为适应度的尺度变换(fitness scaling)。
适应度函数设计不当有可能出现欺骗问题:
(1)进化初期,个别超常个体控制选择过程;
(2)进化末期,个体差异太小导致陷入局部极值。
(7)GA特点
- 自组织、自适应和自学习性
在编码方案、适应度函数及遗传算子确定后,算法将利用进化过程中获得的信息自行组织搜索。 - 本质并行性
内在并行性与内含并行性 - 不需求导
只需目标函数和适应度函数 - 概率转换规则
强调概率转换规则,而不是确定的转换规则
(8)Others
- 选择
适应度计算:
按比例的适应度函数(proportional fitness assignment)
基于排序的适应度计算(Rank-based fitness assignment)
选择算法:
轮盘赌选择(roulette wheel selection)
随机遍历抽样(stochastic universal selection)
局部选择(local selection)
截断选择(truncation selection)
锦标赛选择(tournament selection)
-
交叉
因为编码分二进制和浮点数编码,所以交叉和变异都有两类;实值重组(real valued recombination):
离散重组(discrete recombination)
中间重组(intermediate recombination)
线性重组(linear recombination)
扩展线性重组(extended linear recombination)
二进制交叉(binary valued crossover):
单点交叉(single-point crossover)
多点交叉(multiple-point crossover)
均匀交叉(uniform crossover)
洗牌交叉(shuffle crossover)
缩小代理交叉(crossover with reduced surrogate)
-
变异
实值变异
二进制变异(9)代码实现
用标准遗传算法求函数f(x)=x+10sin(5x)+7cos(4x)的最大值,其中x取值范围为[0,10]。(具有多个局部极值)
思路:
(1)初始化种群数目为NP=50,染色体二进制编码长度为L=20,最大进化代数为G=100,交叉概率为Pc=0.8,变异概率为Pm=0.1
(2)产生初始种群,将二进制编码转换成十进制,计算个体适应度值,并进行归一化;采用基于轮盘赌的选择操作、基于概率的交叉和变异操作,产生新的种群,并把历代的最优个体保留在新种群中,进行下一步遗传操作。
(3)判断是否满足终止条件:若满足,则结束搜索过程,输出优化值;若不满足,则继续进行迭代优化。
%该文件为func1.m
%%%%%%%%%%%%%%%%%%%%%%%%%适应度函数%%%%%%%%%%%%%%%%%%%%%%%%%%%%
function result=func1(x)
fit= x+10*sin(5*x)+7*cos(4*x);
result=fit;
%%
%该脚本是LU在随书源代码的基础上改动,20200915该脚本在matlabR2019a上成功运行
%%%%%%%%%%%%%%%%%%%%标准遗传算法求函数极值%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%初始化参数%%%%%%%%%%%%%%%%%%%%%%%%%%
clear all; %清除所有变量
close all; %清图
clc; %清屏
NP=50; %种群数量
L=20; %二进制数串长度
Pc=0.8; %交叉率
Pm=0.1; %变异率
G=100; %最大遗传代数
Xs=10; %上限
Xx=0; %下限
f=randi([0,1],NP,L); %LU20200915注:随机获得初始种群,储存为50行20列的矩阵,二进制编码所以加上[0,1]
%%
%20200915改动该行代码,将函数由大写改成小写
%X = randi(imax,n) 返回 n×n 矩阵,其中包含从区间 [1,imax] 的均匀离散分布中得到的伪随机整数。
%随书源代码为f=RANDI(NP,L); %随机获得初始种群
%%
%%%%%%%%%%%%%%%%%%%%%%%%%遗传算法循环%%%%%%%%%%%%%%%%%%%%%%%%
for k=1:G
%%%%%%%%%%%%将二进制解码为定义域范围内十进制%%%%%%%%%%%%%%
for i=1:NP
U=f(i,:); %LU20200915注:遍历种群的每个个体
m=0;
for j=1:L
m=U(j)*2^(j-1)+m; %LU20200915注:m即为二进制转换后的十进制数值,此m为第i个体对应的的十进制数值
end
x(i)=Xx+m*(Xs-Xx)/(2^L-1); %LU20200915注:将个体由十进制数值扩缩为,问题中的约束x取值范围[0,10]内
Fit(i)= func1(x(i)); %LU20200915注:计算个体的适应度
end
maxFit=max(Fit); %最大值
minFit=min(Fit); %最小值
rr=find(Fit==maxFit); %LU20200915注:find查找非零元素的索引和值,找到maxFit是哪一个个体并传给rr
fBest=f(rr(1,1),:); %历代最优个体
xBest=x(rr(1,1)); %LU20200915注:历代最优的x值
Fit=(Fit-minFit)/(maxFit-minFit); %归一化适应度值
%%%%%%%%%%%%%%%%%%基于轮盘赌的复制操作%%%%%%%%%%%%%%%%%%%
sum_Fit=sum(Fit);
fitvalue=Fit./sum_Fit; %LU20200915注:用fit矩阵的每个数值除以sum_Fit ,fitvalue即为个体被选取的概率
fitvalue=cumsum(fitvalue); %LU20200915注:cumsum(A) 从 A 中的第一个其大小不等于 1 的数组维度开始返回 A 的累积和
ms=sort(rand(NP,1)); %LU20200915注:rand均匀分布的随机数;由随机数组成的 NP×1 向量
fiti=1;
newi=1;
while newi<=NP
if (ms(newi))<fitvalue(fiti)
nf(newi,:)=f(fiti,:);
newi=newi+1;
else
fiti=fiti+1;
end
end
%%
%LU20200915注:
%nf为选中的个体组成的新种群,即为子种群
%ms为0-1的随机数,从小到大排列的NP个数;cumsum处理后的fitvalue是将种群个体的被选取概率的累积和,0-1
%
%%
%%%%%%%%%%%%%%%%%%%%%%基于概率的交叉操作%%%%%%%%%%%%%%%%%%
for i=1:2:NP
p=rand; %LU20200915注:产生一个0~1之间的数p
if p<Pc %LU20200915注:上行传过来的p小于Pc,则该个体不进行交叉操作,开始下一个个体
q=randi([0,1],L);%随书源码为q=RANDI(1,L);
for j=1:L %LU20200915注: 该for循环遍历第i个体的每个编码,判定nf(i,j)与nf(i+1,j)是否互换(既是交叉)
if q(j)==1;
temp=nf(i+1,j);
nf(i+1,j)=nf(i,j);
nf(i,j)=temp;
end
end
end
end
%%%%%%%%%%%%%%%%%%%基于概率的变异操作%%%%%%%%%%%%%%%%%%%%%%%
i=1;
while i<=round(NP*Pm) %LU20200915注: round四舍五入为最近的小数或整数,该整数即为需要变异的染色体数
h=randi([1,NP],1,1); %随书源码为h=RANDI(1,1,[1,NP]); %随机选取一个需要变异的染色体
for j=1:round(L*Pm) %LU20200915注:该for循环为对选中的染色体进行变异操作
g=randi([1,L],1,1);%RANDI(1,1,[1,L]); %随机需要变异的基因数
nf(h,g)=~nf(h,g); %LU20200915注:对nf(h,g)该基因进行取反(既是变异)
end
i=i+1;
end
f=nf;
f(1,:)=fBest; %保留最优个体在新种群中
trace(k)=maxFit; %历代最优适应度
end
xBest; %最优个体
figure
plot(trace)
xlabel('迭代次数')
ylabel('目标函数值')
title('适应度进化曲线')
%%
%%LU20200915注:该段为我添加的结果显示
fprintf('书中给的优化结果为x=7.8567,函数f(x)的最大值为24.86\n')
fprintf('优化结果为x=%8.5f\n',xBest)
fprintf('函数f(x)的最大值为%8.5f\n',maxFit)