特征选择:A Constrained Competitive Swarm Optimiser withan SVM-based Surrogate Model for Feature Selecton
在机器学习中,分类是一项重要的任务,它根据实例的特征对对象/实例进行分类。分类性能强烈地依赖于数据特征[1]的质量。在许多分类问题中,实例是由一组大量的特征来描述的,也被称为高维数据。例如,文本数据或基因表达数据集可以有数千个特征。现有的分类算法处理这种高维数据具有挑战性。高维数据通常由冗余/不相关的特性组成,这些特性提供了关于类标签的冗余信息,甚至是误导性的信息。这些特征严重降低了分类模型[2]的效率和准确性。此外,由于“维数诅咒”,当特征数量增加时,有效地训练分类器需要指数增加的实例数量
翻译
2023-03-11 09:11:23 ·
498 阅读 ·
0 评论