6 逻辑回归评分卡
学习目标
- 掌握KS值的计算方法
- 知道评分映射方法
1 模型构建流程
1.1 实验设计
新的模型能上线一定要比原有方案有提升,需要通过实验证明
冷启动 | 业务初期 | 成长期 | 波动期 | 策略调整 | 新增数据源 |
---|---|---|---|---|---|
人工审核 | 人工审核 | 新旧模型对比 | 新旧模型对比 | 避免迭代模型 | 新旧模型对比 |
规则模型 | 标准模型 | 长短表现期对比 | 稳定和波动人群 | 线上模型、陪跑 | 和标准模型对比 |
数据驱动模型 | 上一版模型 |
业务逐渐稳定后,人工审核是否会去掉 - 一般算法模型上线后,在高分段和低分段模型表现较好,中间的用户可能需要人工参与审核 - 模型表现越来越好之后,人工审核的需求会逐步降低,但不会去掉
标准模型:逻辑回归,随机森林
策略和模型不会同时调整
1.2 样本设计
ABC卡观察期,表现期
观察期 | 表现期 | |
---|---|---|
实时A卡 | 申请时点往前6~12个月 | FPD7,FPD30 |
白名单A卡 | 邀请时点/激活时点往前6~12个月 | FPD30 |
B卡 | 当前未逾期用户任意用信时点前6~12个月 | 当期/后续2-6期DPD30/DPD60 |
C卡 | 当前逾期未还用户还款日后1天/30天/60天往前6~12个月 | 当期DPD30/60/90 |
还款状态和DPD一起刻画了用户的逾期情况
还款日前(Before Due) | 还款日后(After Due) | |
---|---|---|
完全还款(Fully Repay) | FB(好用户) | FA(催回来了) |
部分还款(Patially Repay) | PB | PA(有意愿,但无力完全还款) |
展期(Extend) | EB(提前展期) | EA (违约后展期,可能是高危用户) |
未还款(Not Repay) | NB | NA |
A卡 申请新客 B卡未逾期老客 C卡 逾期老客
当前逾期:出现逾期且到观测点为止未还清 NA,PA
历史逾期:曾经出现过逾期已还清或当前逾期 FA,NA,PA
举例:
一月 | 二月 | 三月 | 四月 | 五月 | |
---|---|---|---|---|---|
还款状态 | 还清 | 还清 | 还清 | 还清 | 还清 |
DPD | 40 | 0 | 0 | 0 | 0 |
上面情况属于 B卡客户
一月 | 二月 | 三月 | 四月 | 五月 | |
---|---|---|---|---|---|
还款状态 | 还清 | 还清 | 还清 | 还清 | 未还 |
DPD | 0 | 0 | 0 | 0 | 40 |
上面情况属于C卡客户
一月 | 二月 | 三月 | 四月 | 五月 | |
---|---|---|---|---|---|
还款状态 | 还清 | 还清 | 还清 | 未还 | 未还 |
DPD | 40 | 0 | 0 | 40 | 10 |
上面情况属于 C卡客户
- 样本设计表格
训练集 | 测试集 | |||||||
---|---|---|---|---|---|---|---|---|
1月 | 2月 | 3月 | 4月 | 5月 | 6月 | 7月 | 8月 | |
总# |