特征选择(FS)问题被认为是一个NP-hard问题:当一个数据集有N个特征时就会产生个特征子集,几乎不可能获得全局最优解。大多数群智能算法(SI)是受自然界生物群体的觅食以及反捕食行为的启发而产生的,由于SI具有潜在的全局搜索能力、在一定程度上能够避免算法陷入局部最优的特点而在优化领域得到了广泛的应用。
FS问题通常需要满足两个要求:1)提高分类准确率,2)减少被选的特征数。所以FS属于多目标优化问题,但大多数群智能算法将这两个目标结合到一起使其成为单目标优化问题(通常通过加权因子来实现,见公式5),这样处理虽然降低了算法分析的难度但对加权因子的选取没有理论支撑,而且还会带来其他隐患。所以将特征选择问题考虑成多目标优化问题至关重要。
多目标优化往往是为了找出帕累托前沿(Pareto Front),下面对涉及到的相关知识进行介绍。
A dynamic locality multi-objective salp swarm algorithm for feature selection