1.SFFS特征搜索以及搜索工具

该博客介绍了在生物医学信号处理领域,如语音和手写文本处理中,如何处理高维参数化空间的问题。特征选择是一个关键步骤,用于缓解‘维度的诅咒’带来的过拟合风险。SFFS软件提供了一种选择最佳特征子集的方法,支持多种分类和回归技术,并通过交叉验证进行评估。软件包括18个分类和10个回归任务的评估指标。源代码和示例数据可在提供的网址下载。
摘要由CSDN通过智能技术生成

 

    在这里引用了http://splab.cz/en/download/software/software-pro-sekvencni-selekci-priznaku中的话:在生物医学信号处理领域(如语音信号处理,手写文本处理,等等),它经常发生参数化过程的结果(参数化是我们量化与所谓有用的信息存储在数据参数)是一个高维参数化空间。它在参数化矩阵中描述了数据集中所有观测数据的计算参数(特征)。在大多数情况下,后续步骤是分析参数化矩阵,包括特征选择步骤,以选择可能的最佳特征子集,这是最适合后续分类或回归任务的子集。特征选择的一步是最重要的步骤之一,数据分析和问题的维数,也称为“维度的诅咒”描述的高维特征空间会导致过度拟合,通常恶化的结果分析。因此,特征选择步骤的目的是为所考虑的应用程序选择具有最高统计相关性的最合适的特征子集。

   软件SFFS可以选择基于分类的最佳特征子集,该软件的实际版本提供了6种可能的分类技术(支持向量机、朴素贝叶斯网络、判别分析、k-最近邻、分类树和高斯混合模型)。它也可以选择基于回归的特征,其中软件提供了回归技术,称为分类和回归树算法。SFFS软件提供了几个指标来评估特征选择过程:18个指标用于分类任务(分类准确性、灵敏度、特异性等);回归任务的10个指标(基尼指数,绝对误差,均方根误差等)。该包还提供了特性选择过程中使用的交叉验证过程(k-fold, leave-one-out)的功能。SFFS软件完全是在MATLAB编程环境下编写的。测试脚本demo_cls.m和demo_reg.M也被提供。脚本从test_cls.Mat和test_reg.Mat文件加载数据,其中包括参数化矩阵“feat_matrix”:行是为观察确定的;为参数确定列,标签向量为"标签"(例如,分类任务:0/1 -健康/无序,回归任务为数字连续标度)。  

   搜索工具包可以从上面的网址下载

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值