特征选择常用算法综述

1 综述

 

(1) 什么是特征选择

特征选择 ( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ) ,或属性选择( Attribute Selection ) ,是指从全部特征中选取一个特征子集,使构造出来的模型更好。

 

(2) 为什么要做特征选择

       在机器学习的实际应用中,特征数量往往较多,其中可能存在不相关的特征,特征之间也可能存在相互依赖,容易导致如下的后果:

  • 特征个数越多,分析特征、训练模型所需的时间就越长。
  • 特征个数越多,容易引起“维度灾难”,模型也会越复杂,其推广能力会下降。

 

特征选择能剔除不相关(irrelevant)或亢余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化了模型,使研究人员易于理解数据产生的过程。

 

 2 特征选择过程

 

2.1 特征选择的一般过程

 

       特征选择的一般过程可用图1表示。首先从特征全集中产生出一个特征子集,然后用评价函数对该特征子集进行评价,评价的结果与停止准则进行比较,若评价结果比停止准则好就停止,否则就继续产生下一组特征子集,继续进行特征选择。选出来的特征子集一般还要验证其有效性。

       综上所述,特征选择过程一般包括产生过程,评价函数,停止准则,验证过程,这4个部分。

 

  (1) 产生过程( Generation Procedure )

         产生过程是搜索特征子集的过程,负责为评价函数提供特征子集。搜索特征子集的过程有多种,将在2.2小节展开介绍。

 

  (2) 评价函数( Evaluation Function )     

         评价函数是评价一个特征子集好坏程度的一个准则。评价函数将在2.3小节展开介绍。

 

  (3) 停止准则( Stopping Criterion )

         停止准则是与评价函数相关的,一般是一个阈值,当评价函数值达到这个阈值后就可停止搜索。

 

  (4) 验证过程( Validation Procedure )

         在验证数据集上验证选出来的特征子集的有效性。

 

图1. 特征选择的过程 ( M. Dash and H. Liu 1997 )

 

2.2 产生过程

      

产生过程是搜索特征子空间的过程。搜索的算法分为完全搜索(Complete),启发式搜索(Heuristic),随机搜索(Random) 3大类,如图2所示。

 

 

 

 图2. 产生过程算法分类 ( M. Dash and H. Liu 1997 )

 

       下面对常见的搜索算法进行简单介绍。

 

 

2.2.1完全搜索

      

  完全搜索分为穷举搜索(Exhaustive)与非穷举搜索(Non-Exhaustive)两类。

  • 6
    点赞
  • 59
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
多源数据融合算法是指将来自不同数据源的信息进行整合和集成,以得到更全面、准确和可靠的结果。这些数据源可以是不同传感器、不同数据库、不同领域的数据等。多源数据融合算法可以解决数据冗余、不一致性和不完整性等问题,提高数据分析和决策的质量。 综述多源数据融合算法的研究可以从以下几个方面入手: 1. 数据匹配与对齐:多源数据往往具有不同的数据格式、分辨率和空间参考系,因此需要进行数据匹配与对齐。常用的方法包括基于特征的匹配、基于几何模型的匹配和基于统计模型的匹配等。 2. 数据融合方法:多源数据融合方法可以分为基于特征的融合、基于模型的融合和基于决策的融合等。基于特征的融合方法通过提取数据的特征信息进行融合;基于模型的融合方法利用数学模型来描述数据之间的关系;基于决策的融合方法则是基于决策理论将不同数据源的信息进行综合评估和决策。 3. 数据融合技术:多源数据融合技术包括传感器级融合、特征级融合和决策级融合等。传感器级融合是将来自不同传感器的原始数据进行融合;特征级融合是将不同数据源的特征信息进行融合;决策级融合是将来自不同数据源的决策结果进行综合。 4. 数据融合评估指标:评估多源数据融合算法的性能可以使用多种指标,如准确率、召回率、F1值、信息增益等。这些指标可以用于衡量数据融合算法对原始数据的保留程度、融合结果的一致性和可靠性等。 综述多源数据融合算法的研究进展和应用领域能够帮助人们更好地理解和应用这一技术,促进多源数据融合算法在实际应用中的发展和应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值