特征选择之包裹式、嵌入式

包裹式
主要思想是反复的构建模型(如SVM或者回归模型)然后选择最好的(或者最差的)特征(可以根据系数来选)
把选出来的特征选出来,然后在剩余的特征上重复这个过程,直到所有的特征都遍历过
这个过程特征被消除的次序就是特征的排序,因此这是一种寻找最优特征子集的贪心算法

from sklearn.svm import  LinearSVC
from sklearn.datasets import  load_iris
from sklearn.feature_selection import RFE

iris=load_iris()
x=iris.data
y=iris.target
estimator=LinearSVC()
selector=RFE(estimator=estimator,n_features_to_select=2)
selector.fit(x,y)
print('特征数:',selector.n_features_)
print('哪些特征被挑选出来了:',selector.support_)
print('特征评分:',selector.ranking_)#第二,第四个为1,所以挑选出来
#特征选择对预测性能的提升没有联系
特征数: 2
哪些特征被挑选出来了: [False  True False  True]
特征评分: [3 1 2 1]

嵌入式特征选择

在嵌入式特征选择中,特征选择算法本身作为组成部分嵌入到学习算法里,最典型的就是决策树算法,如Quinlan的ID3,C4.5以及Breiman的CART算法等,决策树算法在树增长过程的每个递归步都必须选择一个特征,将样本划分成较小的子集,选择特征的一句通常是划分后子节点的纯度,划分后子节点越纯,则说明划分效果越好,可见决策树生成的过程也就是特征选择的过程。

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

WJWFighting

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值