特征选择

一、特征选择的用处

减少特征数量,缩短建模时间,提高建模效率,大数据集 带来的关键信息只聚集在部分或少数特征上,因此需要:

  从中选择出重要的特征使得后续的建模过程只在一部分的特征上构建, 减少维数灾难 现的可能。
 
  去除不相关的特征,留下关键因素,降低学习任务难度 ,更容易挖掘数据本身带有的规 律;同时在特征选择的过程中,会对数据特征的理解更加充分。
 

二、特征来源

1.业务已经整理好各种特征数据,即业务指标,有时称为属性,我们需要去找出适合我们问题需要的特征。 该类特征通常是业务专家指出,通常是挖掘遇到的最初数据来源,是已有特征,也称原始特征。

2.从业务特征中自己去寻找高级数据特征,如若干原始特征的组合后形成一个新特征,即特征衍生

三、特征选择的方法

特征选择方法有很多,主要包含特征减少和特征扩增。

 特征减少

 单变量特征选择方法

  Filter(过滤法)

基于模型的特征选择方法 (非单变量特征选择方法)

  Wrapper(包装法) <
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值