在这里引用了http://splab.cz/en/download/software/software-pro-sekvencni-selekci-priznaku中的话:在生物医学信号处理领域(如语音信号处理,手写文本处理,等等),它经常发生参数化过程的结果(参数化是我们量化与所谓有用的信息存储在数据参数)是一个高维参数化空间。它在参数化矩阵中描述了数据集中所有观测数据的计算参数(特征)。在大多数情况下,后续步骤是分析参数化矩阵,包括特征选择步骤,以选择可能的最佳特征子集,这是最适合后续分类或回归任务的子集。特征选择的一步是最重要的步骤之一,数据分析和问题的维数,也称为“维度的诅咒”描述的高维特征空间会导致过度拟合,通常恶化的结果分析。因此,特征选择步骤的目的是为所考虑的应用程序选择具有最高统计相关性的最合适的特征子集。
软件SFFS可以选择基于分类的最佳特征子集,该软件的实际版本提供了6种可能的分类技术(支持向量机、朴素贝叶斯网络、判别分析、k-最近邻、分类树和高斯混合模型)。它也可以选择基于回归的特征,其中软件提供了回归技术,称为分类和回归树算法。SFFS软件提供了几个指标来评估特征选择过程:18个指标用于分类任务(分类准确性、灵敏度、特异性等);回归任务的10个指标(基尼指数,绝对误差,均方根误差等)。该包还提供了特性选择过程中使用的交叉验证过程(k-fold, leave-one-out)的功能。SFFS软件完全是在MATLAB编程环境下编写的。测试脚本demo_cls.m和demo_reg.M也被提供。脚本从test_cls.Mat和test_reg.Mat文件加载数据,其中包括参数化矩阵“feat_matrix”:行是为观察确定的;为参数确定列,标签向量为"标签"(例如,分类任务:0/1 -健康/无序,回归任务为数字连续标度)。
搜索工具包可以从上面的网址下载