参数是指算法中的未知数,有的需要人为指定,比如神经网络算法中的学习效率,有的是从数据中拟合而来,比如线性回归中的系数,如此等等。在使用选定算法进行建模时,设定或得到的参数很可能不是最优或接近最优的,这时需要对参数进行优化以得到更优的预测模型。常用的参数优化方法主要包括交叉验证、网格搜索、遗传算法、粒子群优化、模拟退火,本节介绍遗传算法。
遗传算法实质:选定一批最佳参数,使得目标函数最优。
1.基本概念
遗传算法是模拟自然界遗传选择与淘汰的生物进化计算模型。达尔文的自然选择学说认为,遗传和变异是决定生物进化的内在因素。遗传是指父代与子代之间,在性状上的相似现象,而变异是指父代与子代之间以及子代的个体之间,在性状上或多或少地存在的差异现象,变异能够改变生物的性状以适应新的环境变化。而生存斗争是生物进化的外在因素,由于弱肉强食的生存斗争不断地进行,其结果是适者生存,具有适应性变异的个体被保留下来,不具有适应性变异的个体被淘汰。更进一步,孟德尔提出了遗传学的两个基本规律:分离律和自由组合律,认为生物是通过基因突变与基因的不同组合和自然选择的长期作用而进化的。