WOE和IV

这篇文章参考了https://blog.csdn.net/shenxiaoming77/article/details/78771698,如果想要看WOE和IV的例子可以到这里学习。

另外kaggle有一篇特别好的文章,建议大家可以去看看:https://www.kaggle.com/pavansanagapati/weight-of-evidence-woe-information-value-iv

在开始介绍IV前,需要先了解WOE的概念


WOE

WOE的全称是“Weight of Evidence”,即证据权重。WOE是对原始自变量的一种编码形式。

要对一个连续变量进行WOE编码,需要首先把这个变量进行分组处理(也叫离散化、分箱等等,说的都是一个意思)。分组后,对于第i组,WOE的计算公式如下:

WOE_{i}=ln\frac{P_i(p)}{P_i(n)}=ln\frac {\frac{N_{i}(p)}{N(p)}} {\frac{N_{i}(n)}{N(n)}}

其中,P_i(p)表示当前分组中的正样本占所有正样本的比例,也叫响应比例(风险模型中,对应的是违约客户,总之,指的是模型中预测变量取值为“是”、positive或者1的个体),N_i(p)表示当前分组中的正样本个数,N(p)表示所有的正样本的个数。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值