风控建模系列(六):催收评分卡卡跟贷前申请卡关于目标变量的定义
来恩2018 番茄风控大数据 6天前
在评分卡的所有的开发流程里,我一直在强调最重要的就是关于Y变量的定义了。目标的定义是重中之重。定义一旦出错,之后的一切都白干了。
在催收评分卡跟贷前评分卡里,目标变量的定义非常不一样。其实在信贷模型里,评分卡放置的位置不一样,哪怕是提前一个节点,模型的定义就需要稍微修改,起码有些数据就不能用了。比如在贷前卡里,反欺诈的强变量数据反而是不能用的。这些大家是否理解透?
好的,下面我们就来关于A卡跟C的定义展开详细的讨论:
当然我知道很多同学都看过A卡的定义,那C卡的定义,是否有了解过?
第一部分:先来介绍A卡:
分析A卡前,需要看两个表vintage跟flow rate
Vintage表—账龄表
这个是根据客群的资产表现做的一张表:
清洗步骤是:
1)先将每个月的booking的金额做一个统一的规整,得到一张booking金额表·
2)将每个月charge_off,逐一统计
3)最后将步骤2中的进行cumulati