学习周报20200621 | 风控、模型、回顾

本文整理了风控建模的关键知识点,包括评分卡的开发过程,EDA(探索性数据分析)的应用,以及滚动率、迁徙率在建模中的角色。此外,还探讨了AUC、KS的定义,特征工程的操作,模型评估方法和模型上线后的持续监测指标。
摘要由CSDN通过智能技术生成

这周因为一些原因需要整理一些风控建模的知识点,顺便在这里整理一下,一起来回顾回顾。

一、评分卡开发过程

1、信用评分卡分为:申请评分卡和行为评分卡。前者对新贷款申请进行筛选并判断其违约风险,后者则是对审批通过的贷款账户进行覆盖整个贷款周期的管理。

2、典型的评分卡开发流程包括:问题准备、数据获取与整合、EDA、数据准备、变量选择、模型开发、模型检验和评价、评分卡实施、模型检测。

3、标准评分卡基于logistic回归模型,其本质是线性回归的扩展,通过一个Link function的函数形式进行转换而获得。

4、模型验证需要满足4项基本要求:

  • 达到可接受的准确性水平

  • 必须稳健,适用于更广范围的数据集

  • 必须简单

  • 必须可解释,也就是说业务变量及其预测值方面是可解释的

二、EDA

1、EDA叫做探索性数据分析,需要做以下的探索:

  • 变量的统计特性和分布

  • 候选变量与状态变量之间、候选变量相互之间是否存在关联性或相关性

  • 检查缺失值与极值,评估对模型的影响

  • 探索每个候选变量的target分布

2、P值是用来判断假设检验结果的一个参数,如果P值很小则代表原假设发生的概率很小,根据小概率原理可以拒绝原假设。

三、常见问答简单梳理

1、滚动率、迁徙率分析是什么?如何在建模中应用。
滚动率分析:滚动率分析就是从某个观察点之前的一段时间(称为观察期)的最坏的状态向观察点之后的一段时间(称为表现期)的最坏状态的发展变化情况。

1)正常的客户,在未来6个月里,有96%会保持正常状态;

2)逾期1期的客户,未来有81%会回到正常状态,即从良率为81%,有6%会恶化(从M1变为M1+);

3)逾期2期的客户,从良率为23%,有39%会恶化;

4)逾期3期的客户,从良率为14%,有61%会恶化;

5)逾期4期及以上的客户,从良率仅为4%,有82%会继续此状态。

那么,如何结合这些滚动率的结果来设置我们的target呢?(Y变量)

此图统计的逾期用的是月末的逾期状态(有些时候也可以使用历史逾期状态&#

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值