互信息特征选择python_特征选择:方差选择法、卡方检验、互信息法、递归特征消除、L1范数、树模型...

特征选择主要从两个方面入手:

特征是否发散:特征发散说明特征的方差大,能够根据取值的差异化度量目标信息.

特征与目标相关性:优先选取与目标高度相关性的.

对于特征选择,有时候我们需要考虑分类变量和连续变量的不同.

1.过滤法:按照发散性或者相关性对各个特征进行评分,设定阈值或者待选择阈值的个数选择特征

方差选择法:建议作为数值特征的筛选方法

计算各个特征的方差,然后根据阈值,选择方差大于阈值的特征

from sklearn.feature_selection importVarianceThresholdfrom sklearn.datasets importload_irisimportpandas as pd

X,y= load_iris(return_X_y=True)

X_df= pd.DataFrame(X,columns=list("ABCD"))#建议作为数值特征的筛选方法,对于分类特征可以考虑每个类别的占比问题

ts = 0.5vt= VarianceThreshold(threshold=ts)

vt.fit(X_df)#查看各个特征的方差

dict_variance ={}for i,j inzip(X_df.columns.values,vt.variances_):

dict_variance[i]=j

#获取保留了的特征的特征名

ls=list()for i,j indict_variance.items():if j >=ts:

ls.append(i)

X_new= pd.DataFrame(vt.f

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值