近年来,一些新的研究方法,如蚁羣算法、人工神经网络、细胞自动机、人工免疫算法、进化算法等,它们通过模拟某一自然现象或过程(“拟物”或“仿生”)来求得问题解决的办法,具有高度并行与自组织、自适应和自学习等特征,已经在人工智能、机器学习、数据挖掘等领域中显示出强大的生命力与进一步发展的潜力。
在论文 基因表达式编程理论及其监督及其学习模型研究- 张克俊 中 提到:
通过构造独特的适应值函数和交叉验证方法来获得算法提前终止的条件,相关实验究证明,采用改进的基因表达式编程算法比基本基因表达式编程算法和其它机器学习方法所构建的监督机器学习模型在噪声数据处理能力和泛化能力上有明显的提高
GEP在解码时,按照从左到右的顺序读取基因中的一个个字符,然后根据语法规则将基因映射为相应的表达式树。
GEP 的这种染色体结构兼备了GA 和GP 的个体组织方法的优点,因此在解决很多问题上,GEP 的效率远远要高于GA 和GP。
基因表达式编程在监督机器学习中的应用研究成果表明,其非常适合于解决分类、复杂函数关系发现问题
基本GEP算法伪代码如下图所示:
种羣:由多个等长的个体组成;
个体:(染色体),包含一个以上的等长基因;
基因:头部 + 尾部
头部:终结符集T+ 函数符集F( +、-、*、/、%、sin、cos、tan、max、min、与、或、非、等等)
尾部:终结符集F (GEP输入、常量、变量 等等)
GEP的