没有足够的值_WOE与IV值浅谈

本文介绍了WOE(Weight of Evidence)和IV(Information Value)的概念及其在信用评分卡、变量筛选和逻辑回归中的作用。WOE用于衡量各变量分箱对目标变量的预测能力,IV值则用于评价变量的整体预测能力。文章详细阐述了WOE的计算方法,强调了分箱的重要性,并讨论了WOE编码的优势和缺点。同时,还提及了IV值作为选择变量的标准及其与PSI的关系。
摘要由CSDN通过智能技术生成

把最近看到的WOE与IV的资料做一个简单的整理

计算WOE(weight of evidence)证据权重和IV值的意义是

(1)IV值可以衡量各变量对y的预测能力,用于筛选变量。

(2)对离散型变量,woe可以观察各个level间的跳转对odds的提升是否呈线性,而IV可以衡量变量整体(而不是每个level)的预测能力

(3)对连续型变量,woe和IV值为分箱的合理性提供了一定的依据。

(4)用woe编码可以处理缺失值问题。

一、WOE的计算方式

其中

是第i箱中坏客户的人数

是第i箱中好客户人数

是总共坏客户人数

总共好客户人数

实质上WOE表示的是当前分箱中好坏客户的各自占总的好坏客户比例的差异

如果WOE的绝对值越大,这种差异就越明显,绝对值越小就表明差异不明显。如果WOE为0,则说明该分箱中好坏客户比例等于随机坏客户和好客户比值,此时这个分箱就无预测能力

用年龄作为计算WOE的例子,先统计不同层的好坏客户数量

c758b15c78c31500b7d7b1b4c81457cb.png

计算各层好坏客户比例(相对于总体好坏客户的比例)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值