python基因表达式编程_基因表达式编程的任务指派问题求解算法设计与实现

本文探讨了如何使用基因表达式编程(GEP)解决任务指派问题(TAP),阐述了GEP的基本概念、算法流程、多基因家族结构,并详细介绍了算法设计中的选择算子、逆串操作、插串操作以及适应度函数。通过实验分析,证明了GEP在TAP问题上的高效性,并展示了算法的收敛性和稳定性。
摘要由CSDN通过智能技术生成

任务指派问题(Task

Assignment Problem, TAP)是指这样一类问题:有若干资源和若干任务,如何科学合理的进行资源优化和配置,从而产生最大化的经济效益和社会效益或者说完成这些任务的成本量最小,即使得指派方案总体效果最佳。这类的问题有广泛的研究和应用背景,如一个单位有若干项工作需要分配给若干人(或部门)来完成;学校有若干班级需要安排在若干教室里上课等[1]。

任务指派问题是典型的组合优化问题,是典型的NP问题之一,从而得到了广泛的关注和研究,有众多的研究方法解决这类问题,其中有匈牙利法[1]、蚁群算法[2]、模拟退火方法[3]、基于整数规划的方法[4]等。

基因表达式编程(Gene Expression Programming,GEP)是由葡萄牙科学家FerreiraC.

2001年提出来的一种新型遗传算法[5],其特点是将基因型和表现型分离,比传统的遗传编程(GeneticProgramming,

GP)快2~4个数量级[5],因而得到了广泛的关注和研究,已经被广泛应用到数据挖掘的各个领域[6]。

本文设计了基于GEP思想的TAP问题求解算法,并利用C#编程实现了该算法,同时,通过实例表明算法正确性和有效性。论文余下部分的组织结构如下:第二节阐述了GEP解决TAP问题时染色体结构和遗传操作;第三节说明了算法设计的整体思路;第四节结合实例,说明算法的运行效率;最后第五节是的结论和下一步工作。

2

基因表达式编程概要

2.1基因表达式编程算法流程

基因表达式编程(GEP)是将基因型和表现型分开的一种遗传算法,也就是在该算法中有2个实体:表达树和染色体,GEP进化中,遗传操作在固定长度的线性编码的染色体上进行,而个体评价是在染色体解码得到的表达树上进行,即操作和评价相分离。

GEP使用Karva语言对表达树和染色体进行互相编、解码。染色体由若干个基因组成,每个基因由头部和尾部组成,头部可以包含是函数符号和终结符号,尾部仅有终结符号。在GEP中,所有的遗传操作只要保证基因的合法结构,它就能解码为合法的程序[10]。

GEP基本算法流程见图1所示。

正是GEP基因结构性和简单线性编码,使得GEP的遗传算子比较丰富,主要有:变异、逆串、插串、根插串、基因插串、单点重组、2点重组、基因重组等八大算子。其算法的具体技术细节详解文献[5]。

2.2 GEP多基因家族结构

对于任务指派问题求解,问题中有两类信息:资源和任务,每一类信息在GEP的基因表达式中用一个多基因(Multi-gene)结构表示,因此对该问题,使用二基因家族(Multi-geneFamilies)的染色体结构表示。例1是一个简单例子说明多基因家族问题。

例2有6个人员和6项任务,每个人完成不同的任务时工作成本不同,我们的问题是,每人安排一项任务,怎样安排使得完成整个任务的成本最小?

显然,该问题共有6!种按排方案,是典型的NP问题。我们对人员用数字1-6表示,任务用字母A-F表示。图2(a)中是GEP解决该问题时一个二基因家族染色体表示,即图2(b)表示的工作指派方案的信息表示。图2(b)表示该染色体解码对应的表达树,即图2(a)染色体的解码信息,表达了一种任务指派方案。

需要指出,染色体的编码是随机生成,只要保证染色体的合法结构,即串的前6位表示人员信息,后6位表示任务信息,且每种信息是一种排列即可,则每个染色体都能正确的表示一个合法程序,即正确的任务指派方案。

3

主要算法设计

第2节介绍的GEP基本的流程和多基因家族的编码。本节介绍本算法设计中选择操作、逆串操作、插串操作和适应度函数的设计问题。

3.1选择算子设计

GEP像其它遗传算法一样引入随机选择方法模拟自然选择过程,其中轮盘赌方法是一个简单的实现模拟自然选择的方式,为了保证进化过程不至于破坏已经获得的最好解,在轮盘赌的基础上加了保持最优解的策略。

实现方法是对种群的各个个体进行适应性评价,计算出适应度函数值,然后定义各个个体的选择概率为个体的适应度函数值与所有适应度函数值的累加和。算法描述如图3所示。

带有精英选择的选择算法

1

For i=1 to size //size为种群规模

2

计算Fi//Fi是i个体适应度函数值

3

F=sum(Fi) //F适应度函数值之和

4

Fi值最大的个体到下一代第1位置

5

P1=F1/F

6

For i=2 to size//计算累积概率

7

Pi=Pi-1+Fi/F

8

For i=2 to size

9

产生0~1之间随机数r

10

//根据r值范围,确定被选中的个体

11

If r

12

Else ifr>=pj-1 and r

13

选择第j个个体复制到第i位置

图3选择算子算法描述

3.2遗传算子设计

本算法主要使用了两个遗传操作:逆串(inversion)操作和插串(insertion)操作。逆串操作是指染色体中选择两点,把这两点间的串的顺序倒置的操作;插串算子是选择一个待插入的基因位和一个基因串片断,将该片断插入到待插入的基因位,原来位置的基因串依次后退的遗传操作。例2对这两种操作做简单说明。

例2设父辈染色体如例1所示。即P=632451EDFCBA。

逆串操作:随机选择一个基因家族,如第一个基因家族;再随机生成0~5之间的两个随机数,如2,4,将第2~4位之间基因逆置,得到S=635421

EDFCBA;

插串操作:随机选择一个基因家族,如第一个基因家族;再随机生成0~5之间随机数,如2,4,第三步随机生成0~2(两个随机数的最小值)之间随机数,如1,将第2~4位之间基因插入到1开始的基因位置,其他基因依次后移,得到S=624531EDFCBA。

逆串遗传算子的算法描述见图4所示,插串操作同样的方法可以设计,这里因篇幅限制,略去。

逆串遗传操作算法

1

For i=1 to size //size为种群规模

2

{产生0~1随机数r

3

If r

4

{ p=random(0,1) //随机选择0或1

5

If p==0 then//在第一基因家族

6

{产生0~L/2-1之间随机数r1,r2

7

//L为染色体长度,设r1

8

将r1~r2之间基因取逆放在原位置

9

}else

10

{产生L/2~L之间随机数r1,r2

11

//设r1

12

将r1~r2之间基因取逆放在原位置

13

}

14

} }

图4逆串算子算法描述

3.3适应度函数设计

适应度函数确定,是进化计算的关键问题,它给定了进化计算的进化的方向和速度。TAP问题是一个组合优化问题,目标确定一个最优指派方案。常有2种方法确定这类问题适应度函数。

第一种使用公式(1)确定个体的适应度。

fi=Tg-Ti+1(1)

其中fi为个体i的适应度值,Tg为当前代中成本最大的个体的适应度函数值,Ti为当前代个体i的适应度函数值。这种评价方法简单实效。

第二种采用公式(2)确定个体适应度。

fi=M-Ti;(2)

其中M为预先指定的一个大数,为固定值。fi,Ti和第一种评价函数代表的意义相同。这种方法中的M不太好确定。我们这里使用公式(1)。

4

实验分析与研究

4.1实验数据及参数

本实验程序用VS2010环境下C#编写。

设某单位有6人计划安排6项任务,每人完成且只完成一项任务,各人的完成每项任务的成本见表1。现在使用本程序求解该问题。

表1任务指派成本矩阵

ABCDEF

569746

835467

624789

976845

743689

578964

表2给出实验参数,进化中选择函数是具有精英保持策略的轮盘赌算法。

表2进化中使用参数

参数项

参数值

运行最大代数

200

染色体长度

12

群体规模

10

逆串率

0.25

插串率

0.1

适应度函数

公式(1)

4.2实验结果及分析

按表2的进化参数,独立运行程序100次,平均得到的最小代价约是22。图4是一次运行的成本变化曲线。

任务指派方案为:426315EDFBAC,即4-E,2-D,6-F,3-B,1-A,5-C。

图4TAP进化过程

该次运行的平均适应度函数值的变化曲线如图5所示。分析图4,在前20代系统快速收敛,在100代左右收敛到满意的近似解,如103代时,最小代价值为23。在120代s时系统趋于稳定。

图5适应度的变化曲线

图5是运行过程中适应度变化情况,为了清晰,图中每隔10代取样一次绘制的图形。图5看出,系统进化过程仍保持较高的基因多样性,所以系统是健康强壮的。

5

结论及下一步工作

GEP是遗传算法发展的新阶段,它继承了GAs线性定长编码的优点,又继承GP对复杂问题的表达能力,从而在基因编码问题上使用了简单编码可以应对复杂的问题[7]。

本文介绍了GEP模型的工作原理,针对TAP问题进行了基于GEP的算法设计,用C#加以实现,进行实验研究,说明GEP能高效解决TAP问题,下一步工作我们将进一步完善系统,扩大应用,将该工作推广到实际应用中去。

参考文献

[1]郑烨,王明杰,樊娟.基于匈牙利法的企业员工任务分配问题研究[J].统计与决,2011,(5):182-185.

[2]张群,薛雨石.蚁群算法在机队指派问题中的应用[J].中国管理信息化,2011,14(13):79-80.

[3]赵越.模拟退火算法求解指派问题新探[J].吉林建筑工程学院学报,2011,

28(4):61-63

[4]任先海,杨乐平,朱彦伟.基于整数规划的在轨服务任务指派问题研究[J].装备指挥技术学院学报,2008,19(2):52-56.

[6]朱明放,唐常杰,代术成,等.基于中性突变的朴素基因表达式编程[J].计算机研究与发展,2010,47(2):292-299.

[7]唐常杰,张天庆,左劼,等.基于基因表达式编程的知识发现-沿革、成果和发展方向[J].计算机应用,

2004,24(10):7-10.

[8]朱明放,王宏涛,任艳玲.基于基因表达式编程的私人汽车拥有量建模和预测[J].计算机应用研究,2010,27(3):958-960.

[9]朱明放.基于基因表达式编程的TSP问题求解[J].计算机工程与应用,2008,44(23)

:53-55.

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值