特征选择--IV和WOE方法

        因为之前看到有关WOE特征编码的方式,比较好奇,就去研究下,偶然之间看到一博客文章,写的是真好,链接如下,https://blog.csdn.net/kevin7658/article/details/50780391

        这篇文章清晰表明了IV和WOE的关系,也说清楚了根据IV值的高低,去选择筛选特征,之后我们可以将筛选出来的特征去做其他方式的编码。

        简单说,就是将需要的特征列算出各自的IV值,然后将其排序,IV值越高的特征列说明其预测能力越高,IV值越低的特征列说明其预测能力越低。可以根据业务情况,进行筛选特征列,过滤掉IV值低的特征列。

       github有位国人写了一个关于WOE编码的包,项目地址如下:

       https://github.com/boredbird/woe,里面也有关于怎么使用这个包的例子,可以查看。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值