1、主要工作
采用遗传算法对男女生样本数据中的身高,体重,喜欢数学,喜欢文学,喜欢运动,喜欢模式识别共6个特征进行特征选择,并基于所得到的最佳特征采用SVM设计男女生分类器,并计算模型预测性能(包含SE,SP,ACC和AUC)。
2、工作具体内容
2.1 遗传算法介绍
几个术语:
基因链码:使用遗传算法时把问题的每个解,编码成一个基因链码。比如要从D个特征中挑选d个,就用一个D位的0或1组成的字符串表示一种特征组合。1表示该特征被选中,每个基因链码代表一个解, 称作一个“个体”,其中的每一位看作一个“基因”。
群体:若干个体的集合,也就是一些解的集合。
交叉:选择群体中的两个个体,以这两个个体为双亲作基因链码的交叉,从而产生两个新的个体,作为后代。
例如:
交叉前:
00000|011100000000|10000
11100|000001111110|00101
交叉后:
00000|000001111110|10000
11100|011100000000|00101
变异:对某个体,随机选取其中一位,将其翻转。
变异前:
000001110000000010000
变异后:
000001110000100010000
适应度:对每个解,以给定的优化准则来评价其性能的优劣,作为其适应度遗传。
2.1 遗传算法原理
遗传算法模拟了自然选择和遗传中发生的复制、交叉和变异等现象,从任一初始种群(population)出发,通过随机选择、交叉和变异操作,产生一群更适应环境的个体,使群体进化到搜索空间中越来越好的区域,这样一代一代地不