遗传算法

最新推荐文章于 2024-09-12 22:22:14 发布

奔跑着的孩子

最新推荐文章于 2024-09-12 22:22:14 发布

阅读量3.1k

点赞数

分类专栏：机器学习文章标签：算法数学搜索

机器学习专栏收录该内容

12 篇文章 5 订阅

订阅专栏

遗传学算法和遗传学中的基础术语比较

染色体(chromosome)	数据,数组,序列
基因(gene)	单个元素,位
等位基因(allele)	数据值,属性,值
基因座(locus)	位置,iterator位置
表现型(phenotype)	参数集,解码结构,候选解
遗传隐匿(epistasis)	非线性

染色体又可以叫做基因型个体(individuals),一定数量的个体组成了群体(population),群体中个体的数量叫做群体大小。各个个体对环境的适应程度叫做适应度(fitness)

遗传算法的准备工作:
1)数据转换操作,包括表现型到基因型的转换和基因型到表现型的转换。前者是把求解空间中的参数转化成遗传空间中的染色体或者个体(encoding),后者是它的逆操作(decoding)
2)确定适应度计算函数,可以将个体值经过该函数转换为该个体的适应度,该适应度的高低要能充分反映该个体对于解得优秀程度。非常重要的过程！

遗传算法的基本步骤
遗传算法是具有"生成+检测"(generate-and-test)的迭代过程的搜索算法。
基本过程为:
1)编码,创建初始集团
2)集团中个体适应度计算
3)评估适应度
4)根据适应度选择个体
5)被选择个体进行交叉繁殖,
6)在繁殖的过程中引入变异机制
7)繁殖出新的集团,回到第二步

一个简单的遗传算法的例子:求 [0,31]范围内的y=(x-10)^2的最小值
1)编码算法选择为"将x转化为2进制的串",串的长度为5位。(等位基因的值为0 or 1)
2)计算适应度的方法是:先将个体串进行解码,转化为int型的x值,然后使用y=(x-10)^2作为其适应度计算合适(由于是最小值,所以结果越小,适应度也越好)
3)正式开始,先设置群体大小为4,然后初始化群体 => (在[0,31]范围内随机选取4个整数就可以,编码)
4)计算适应度Fi(由于是最小值,可以选取一个大的基准线1000,Fi = 1000 - (x-10)^2)
5)计算每个个体的选择概率.选择概率要能够反映个体的优秀程度.这里用一个很简单的方法来确定选择概率
P=Fi / TOTAL(Fi).
6)选择.
根据所有个体的选择概率进行淘汰选择.这里使用的是一个赌轮的方式进行淘汰选择.先按照每个个体的选择概率创建一个赌轮,然后选取4次,每次先产生一个0-1的随机小数,然后判断该随机数落在那个段内就选取相对应的个体.这个过程中,选取概率P高的个体将可能被多次选择,而概率低的就可能被淘汰.

1 基本概念

　　遗传算法(GA)的概念是由Holland于1973年受生物进化论的启发而首次提出的。它是一种通过模拟生物界自然选择和遗传机制的随机搜索算法。

　　遗传算法基本思想是模拟自然界优胜劣汰的进化现象，把搜索空间映射为遗传空间，把可能的解编码成一个向量——染色体，向量的每个元素称为基因。通过不断计算各染色体的适应值，选择最好的染色体，获得最优解。　

　　个体就是模拟生物个体而对问题中的对象（一般就是问题的解）的一种称呼，一个个体也就是搜索空间中的一个点。　　

　　种群就是模拟生物种群而由若干个体组成的群体, 它一般是整个搜索空间的一个很小的子集。　

　　适应度(fitness)就是借鉴生物个体对环境的适应程度,而对问题中的个体对象所设计的表征其优劣的一种测度。

　　适应度函数(fitness function)就是问题中的全体个体与其适应度之间的一个对应关系。它一般是一个实值函数。该函数就是遗传算法中指导搜索的评价函数。　

　　染色体（chromosome）就是问题中个体的某种字符串形式的编码表示。字符串中的字符也就称为基因（gene）。

　　　　例如：个体染色体

　　　　　　　　9 ---- 1001

　　　（2，5，6）---- 010 101 110

　　遗传操作，也称遗传算子(genetic operator)，就是关于染色体的运算。

选择-复制(selection-reproduction)

　　　　　　通常做法是：对于一个规模为N的种群S,按每个染色体xi∈S的选择概率P(xi)所决定的选中机会，分N次从S中随机选定N个染色体, 并进行复制。

　　　　交叉(crossover，亦称交换、交配或杂交)

　　　　　　就是互换两个染色体某些位上的基因。

　　　　　　例如, 设染色体 s1=01001011, s2=10010101, 交换其后4位基因, 即：

　　　　　　s1′=01000101, s2′=10011011 可以看做是原染色体s1和s2的子代染色体。

　　　　变异(mutation，亦称突变)

　　　　　　就是改变染色体某个(些)位上的基因。

　　　　　　例如, 设染色体 s=11001101 将其第三位上的0变为1, 即：

　　　　　　s=11001101 →11101101= s′。 s′也可以看做是原染色体s的子代染色体。

2遗传算法基本流程

　　基本遗传算法步骤：

　　　　步1 在搜索空间U上定义一个适应度函数f(x)，给定种群规模N，交叉率Pc和变异率Pm，代数T；　

　　　　步2 随机产生U中的N个个体s1, s2, …, sN，组成初始种群S={s1, s2, …, sN}，置代数计数器t=1；　

　　　　步3 计算S中每个个体的适应度f() ；　　

　　　　步4 若终止条件满足，则取S中适应度最大的个体作为所求结果，算法结束。

　　　　步5 按选择概率P(xi)所决定的选中机会，每次从S中随机选定1个个体并将其染色体复制，共做N次，然后将复制所得的N个染色体组成群体S1；

　　　　步6 按交叉率Pc所决定的参加交叉的染色体数c，从S1中随机确定c个染色体，配对进行交叉操作，并用产生的新染色体代替原染色体，得群体S2；

　　　　步7 按变异率Pm所决定的变异次数m，从S2中随机确定m个染色体，分别进行变异操作，并用产生的新染色体代替原染色体，得群体S3；　　

　　　　步8 将群体S3作为新一代种群，即用S3代替S，t = t+1，转步3；

3举例

例：利用遗传算法求解区间［0,31］上的二次函数y=x2的最大值。

　　分析：原问题可转化为在区间［0, 31］中搜索能使y取最大值的点a的问题。那么［0, 31］中的点x就是个体, 函数值f(x)恰好就可以作为x的适应度，区间［0, 31］就是一个(解)空间。这样, 只要能给出个体x的适当染色体编码, 该问题就可以用遗传算法来解决。

　　(1) 设定种群规模,编码染色体，产生初始种群。

　　　　将种群规模设定为4；用5位二进制数编码染色体；取下列个体组成初始种群

　　　　S1: s1= 13 (01101), s2= 24 (11000) s3= 8 (01000), s4= 19 (10011)

　　(2) 定义适应度函数, 取适应度函数：f (x)=x*x

　　(3) 计算各代种群中的各个体的适应度, 并对其染色体进行遗传操作,直到适应度最高的个体(即31（11111）)出现为止。

　　　　首先计算种群S1中各个体s1= 13(01101), s2= 24(11000) s3= 8(01000), s4= 19(10011) 的适应度f (si) 。

　　　　容易求得 f (s1) = f(13) = 13*13= 169

　　　　　　　　 f (s2) = f(24) = 242*24= 576

　　　　　　　　 f (s3) = f(8) = 8*8 = 64

　　　　　　　　 f (s4) = f(19) = 19*19 = 361

　　　　再计算种群S1中各个体的选择概率。选择概率的计算公式为

　　　　由此可求得 P(s1) = P(13) = 0.14

　　　　　　　　　 P(s2) = P(24) = 0.49

　　　　　　　　　 P(s3) = P(8) = 0.06

　　　　　　　　　 P(s4) = P(19) = 0.31

　　　　赌轮选择法：

　　　　　　在算法中赌轮选择法可用下面的子过程来模拟:

　　　　　　　　① 在［0, 1］区间内产生一个均匀分布的随机数r。　　

　　　　　　　　② 若r≤q1,则染色体x1被选中。　　

　　　　　　　　③ 若qk-1<r≤qk(2≤k≤N), 则染色体xk被选中。其中的qi称为染色体xi (i=1, 2, …, n)的积累概率, 其计算公式为

　　（4）选择-复制　

　　　　设从区间［0, 1］中产生4个随机数如下:

　　　　r1 = 0.450126, r2 = 0.110347 r3 = 0.572496, r4 = 0.98503

染色体	适应度	选择概率	积累概率	选中次数
s1=01101	169	0.14	0.14	1
s2=11000	576	0.49	0.63	2
s3=01000	64	0.06	0.69	0
s4=10011	361	0.31	1.00

　　于是，经复制得群体： s1’ =11000（24）, s2’ =01101（13） s3’ =11000（24）, s4’ =10011（19）

　　（5）交叉

　　　　设交叉率pc=100%，即S1中的全体染色体都参加交叉运算。

　　　　设s1’与s2’配对，s3’与s4’配对。分别交换后两位基因，得新染色体：

　　　　　　s1’’=11001（25）, s2’’=01100（12） s3’’=11011（27）, s4’’=10000（16）　　

　　（6）变异

　　　　设变异率pm=0.001。

　　　　这样，群体S1中共有 5×4×0.001=0.02 位基因可以变异。 0.02位显然不足1位，所以本轮遗传操作不做变异。

　　　　于是，得到第二代种群S2： s1=11001（25）, s2=01100（12） s3=11011（27）, s4=10000（16）

　　显然，在迭代好多代种群中已经出现了适应度最高的染色体s1=11111。于是，遗传操作终止，将染色体“11111”作为最终结果输出。　　

　　然后，将染色体“11111”解码为表现型，即得所求的最优解：31。将31代入函数y=x2中，即得原问题的解，即函数y=x2的最大值为961。

奔跑着的孩子

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录