特征选择 Feature Selection

特征选择在机器学习中至关重要,旨在降低计算开销,提高分类性能。它包括特征提取和选择,去除不相关或冗余特征。常见的特征选择方法有完全搜索、启发式搜索和随机搜索,如SFS、SBS、分支限界和模拟退火等。评价函数通常分为筛选器和封装器,例如信息增益和分类错误率。停止准则和验证过程确保选择的有效性。
摘要由CSDN通过智能技术生成

目录

1. 什么是特征选择

2. 为什么要做特征选择

3. 特征选择的作用

4. 特征选择过程

5. 常见的特征提取方法


 


1. 什么是特征选择

特征选择 ( Feature Selection )也称特征子集选择( Feature Subset Selection, FSS ) ,或属性选择( Attribute Selection ) ,是指从全部特征中选取一个特征子集,使构造出来的模型更好。特征选择又称独立评估法,在进行特征选择时一般都是利用某种评价函数独立地对每个原始特征项进行评分,然后将它们按分值的高低排序,从中选取若干个分值最高的特征项。

特征选择实际包含两个方面:特征提取和特征选择。特征提取是一种将数据从高维空间到低维空间的变换,达到降维的目的;特征选择是指从一组特征中去除冗余或不相关的特征来降维。两者常联合使用。

2. 为什么要做特征选择

在机器学习的实际应用中,特征数量往往较多,其中可能存在不相关的特征,特征之间也可能存在相互依赖,容易导致如下的后果:

1)特征个数越多,分析特征、训练模型所需的时间就越长。

2)特征个数越多,容易引起“维度灾难”模型也会越复杂,其推广能力下降。

3. 特征选择的作用

特征选择的作用主要是降低计算开销和提高分类性能特征选择能剔除不相关(irrelevant)或亢余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。即可以减小数据处理量、节省处理时间,减轻数据中噪声的影响,提高信息处理系统的性能。另一方面,选取出真正相关的特征简化了模型,使研究人员易于理解数据产生的过程。

4. 特征选择过程

特征选择的一般过程可用图1表示。特征选择过程一般包括产生过程,评价函数,停止准则,验证过程,这4个部分。

图1. 特征选择的过程 ( M. Dash and H. Liu 1997 )

4.1 产生过程( Generation Procedure )

产生过程是搜索特征子集的过程,负责为评价函数提供特征子集。

产生过程是搜索特征子空间的过程。搜索的算法分为完全搜索(Complete),启发式搜索(Heuristic),随机搜索(Random) 3大类,如图2所示。

其中完全搜索方法有:广度优先搜索,DFS,分支限界、定向搜索、最优优先搜索。

启发式搜索

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Matlab中好用的数据降维和特征选择工具包 Copyright (c) 2018, Giorgio Roffo All rights reserved. Redistribution and use in source and binary forms, with or without modification, are permitted provided that the following conditions are met: * Redistributions of source code must retain the above copyright notice, this list of conditions and the following disclaimer. * Redistributions in binary form must reproduce the above copyright notice, this list of conditions and the following disclaimer in the documentation and/or other materials provided with the distribution * Neither the name of University of Glasgow nor the names of its contributors may be used to endorse or promote products derived from this software without specific prior written permission. THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值