评分卡分箱单调性
一、平分卡的使用场景和要求
在信贷场景中,评分卡是以分数的形式来衡量风险几率的一种手段对未来一段时间内违约/逾期/失联概率的预测,通常评分越高越安全根据使用场景分为反欺诈评分卡、申请评分卡、行为评分卡、催收评分卡。
由于评分卡在业务场景中有着很好的可解释性和区分度,在互联网金融风控中作用巨大。
评分卡的一般要求有:
(1)稳定性
当总体逾期/违约概率不变,分数的分步也应该没有改变
(2)良好的区分度
违约人群与正常人群的分数应当有显著的差异,一般是在分数较高的人群中违约人群比率较低,分数较高的人群中违约率较高。即在对应业务分析时具有比较好的解释度。这里就要求变量的和坏客户率具有单调或倒U型。
(3) 预测能力:低分人群的违约率更高
(4) 和逾期概率等价:评分应该可以精准地反应违约/逾期概率,反之亦然
二、为什么分箱
1、特征分箱的目的:
从模型效果上来看,特征分箱主要是为了降低变量的复杂性,减少变量噪音对模型的影响,提高自变量和因变量的相关度。从而使模型更加稳定。
2、特征分箱
(1) 将连续变量离散化
(2)将多状态的离散变量合并成少状态
三、分箱的注意的事项
分箱就是为了做到同组之间的差异尽可能的小,不同组之间的差异尽可能的大。
1、常用的分箱方法
等距、等频、卡方分箱、决策树分箱法
2、分箱的原则
(1)最小分箱占比不低于5%
(2)箱内不能全部是好客户
(3)连续箱单调
详细:https://blog.csdn.net/shenxiaoming77/article/details/79548807
https://blog.csdn.net/starzhou/article/details/80873525