总结:
为了改善粒子群优化算法在容易造成局部最优并且缺乏多样性和全局搜过不平衡等问题, 改文章在粒子群优化算法的基础上提出了基于改进粒子群优化算法的特征选择方法—— HPSO-SCAC。并通过实验验证该算法的性能。
研究背景:
在高维特征空间中,数据的分布具有高非线性的特点;样本数量相对于特征数量显得 不足。所以导致机器学习算法在高维数据中泛化能力较弱。根本原因为数据的特征模 型不合适。解决方法-引入特征选择(本质为一个组合优化问题)。但是高维特征选择 具有一些研究难点①过高的特征维数容易导致计算复杂度剧增和维数灾难问题。②特 征分布的稀疏特性使得从经验数据出发的统计机器学习建模方法出现失效的现象。③ 大样本假设的失效使得基于统计理论建立的特征选择在高维数据中的性能难以得到保 障。因此文章针对机器学习中需求最为迫切的高维特征选择问题进行研究,引入智能 优化算法来解决高维特征选择中的问题。
相关知识:
特征选择方法可以分为①过滤型、②封装型、③嵌入型。
①:过滤型特征选择方法通过数据内在属性衡量个特征对目标类别的辨别能力,并依 据分辨能力的大小对原始数据中的所有特征进行排序,随后依据预定 的阈值来选择出一定数量的特征构成最终特征子集。优点处理时间短,评估效率