IV值

评分模型开发包括变量处理、模型建立、评分转换和模型评估。在变量处理阶段,通过计算WOE值和IV值来筛选和处理变量。IV值大于0.02的变量会被考虑进入模型,若超过0.5则可能用于分群。WOE值反映风险,IV值衡量区分能力。R语言可以便捷地计算IV值。
摘要由CSDN通过智能技术生成

评分模型开发主要分为变量处理、模型建立、评分转换、模型评估4个步骤。
其中在变量处理的时候涉及IV值和WOE值的计算。

基于抽样后得到训练样本集数据,由于变量数量通常较多,不推荐直接采用逐步回归的方法进行筛选。
由于各个变量的量纲和取值区间存在很大的差别,通常会对变量的取值进行分箱并计算 证据权重 WOE值(weight of evidence) ,从而降低变量属性的个数,并且平滑的变量的变化趋势。

接下来,在此基础上计算 信息价值IV(information value) ,
**一般我们选择 IV值大于0.02的那些变量进入模型。
如果IV值大于 0.5 ,改变量就是属于过预测变量,通常被选座分群变量,将样本拆分成多个群体,针对不同的群体分别开发评分卡。**

分群的依据通常也会根据业务上的需要进行设定,常见以区域变量作为分群的标准。

证据权重WOE是用来衡量变量某个熟悉的风险的指标,WOE的计算公式:
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值