风控模型的基础知识

一、 金融风控模型的A卡、B卡、C卡

风控模型根据设定的y变量与可获得的x变量不同,大致可以分为三类:即A卡,B卡,C卡。今天就让我们聊聊三者的区别。

1、A卡(Application score card)

贷前阶段,智能风控带给银行的好处是能够帮助其有效地识别风险,如识别团伙欺诈、羊毛党等高风险骗贷现象,帮助信贷机构降低风险、减少资金损失。
A卡即申请评分模型,此类风控模型的目的在于预测申请时点(申请信用卡、申请贷款)未来一定时间内逾期的概率。Y变量的设定观察点为申请时点,定义为表现期内是否逾期。X变量一般只有客户填写的申请书信息,加上外部查询的数据与征信报告。

2、B卡(Behavior score card)

贷中阶段,智能风控带给银行的好处是按权限进行审批,决定是否放贷、金额、期限及利率等。同时还可以通过贷中监控,结合额度使用率、经济稳定性进行额度调整。
B卡即行为评分模型,此类风控模型的目的在于预测使用时点(获得贷款、信用卡的使用期间)未来一定时间内逾期的概率。Y变量设定观察点为使用期间的某一时点,定义为表现期内是否逾期。由于行为评分模型的观察点在获得贷款或信用卡之后,这段时间内是可以获取到贷款或信用卡的使用还款行为数据的。另外使用过程中同样可以查询外部数据和征信报告的变化,这些行为数据衍生成x变量后,模型的效果会大大提升。

3、C卡(Collection score card)

贷后阶段,智能风控带给银行的好处是对借款人或者企业在一定周期内进行持续地风险监控评估,对于风险较低的客户给予“使用激活”、“余额增长”、“分期循环”、“提前挽留”等策略,对风险高的客户预警提前干预,降低损失,助力客户对存量客户实现精细化分层管理。
C卡即催收评分模型,此类风控模型的目的在于预测进入催收阶段后未来一定时间内还款的概率。Y变量设定的观察点为进入催收阶段的时点,定义为表现期内是否还款。催收评分模型有一个特有的数据,那就是催收的行为。比如打过几次电话,是否约定还款等等,这些催收行为x变量会影响催收模型的效果。

适用场景:

1.使用的时间不同。分别侧重贷前、贷中、贷后;
2.数据要求不同。A卡一般可做贷款0-1年的信用分析,B卡则是在申请人有了一定行为后,有了较大数据进行的分析,一般为3-5年,C卡则对数据要求更大,需加入催收后客户反应等属性数据。
3.每种评分卡的模型会不一样。在A卡中常用的有逻辑回归,AHP等,而在后面两种卡中,常使用多因素逻辑回归,精度等方面更好。

二、表现期&观察期

何为目标(即所谓的y值),在风控模型的门类中一般就是指某个客户或账户是否逾期(通常以0,1)来区分。我们在建立风险模型的时候,不能简单地将逾期客户定为1,未逾期客户定义为0。这需要结合时间点、逾期程度来判断。
在这里插入图片描述

1. 观察期

观察期是相对于观察点而言的。需不需要观察期要根据建立模型的业务应用场景来设定。如果是申请类的模型,只需要观察点就可以了。因为所有的申请信息都是在申请动作完成的那个时点获得的。如果是行为类的模型,就需要一个观察期,在观察期中提取客户行为表现数据,以便进行后续的建模操作。
阶段总结一下,观察点和观察期是衍生x变量的时点或时期,所有的衍生变量要只能在此时间点和此时间点之前生成,不能使用此时间点之后的信息,否则就会产生使用未来信息的情况。

2. 观察点

在这一时间点上,账户和客户的信息被作为“当前月”信息进行提取,等同于对账户/客户进行风险评估的生产系统中的当前月。一般来说,可以使用一个“观察点”来提取历史数据,但如果受到样本量的限制,可以考虑采用迭式(stacking)的方式,即选取多个“观察点”,以便扩大样本量。另外,如果业务发展受季节影响较大,可以考虑在每个相应的季节选取一个“观察点”。

3. 表现期

表现期是对观察点上账户/客户表现进行监控的时间周期。这些账户根据截止到表现点的表现被分类成“好”和“坏”。表现期需要有足够的长度,不能够太短,从而保证样本群体分类的稳定性,使账户/客户的行为充分表现出来。但也不能够过于长,即使可获得很长时间的历史数据,还需要在完整性和数据质量之间保持平衡。

4. 表现点

截止到此时间点账户被分类成好账户和坏账户。
阶段总结,表现期和表现点是定义y变量的时期。

e.g.

弄清了这么几个概念,我们就可以进行目标定义的环节了。风控模型定义y变量的时候,要保证表现期足够,业务不同表现期定义也不同。以信用卡业务为例,一般表现期为一年或一年半。风险表现一般都是滞后的,不经过足够的时间是看不出来的。
其次,坏客户的逾期程度也需要有定义。目的就是让坏人彻底坏,好人真的好。如果坏人不够坏,比如定义逾期1天以上就算坏人的话,是跟好人区分不开的。因为很多人可能是忘记还款了,提醒一下就会还款。
我们设置的好坏客户定义可以这样,如下例:
坏:表现期内发生逾期60天及以上的逾期客户
好:表现期内未发生逾期的客户

三、信用风险

信用风险是银行贷款或投资债券中发生的一种风险,也即为借款者违约的风险。 在过去的数年中,利用新的金融工具管理信用风险的信用衍生工具(Credit Derivatives)发展迅速。 适当利用信用衍生工具可以减少投资者的信用风险。

四、模型评价指标

五、模型调参

  1. 随机森林
    随机森林一般调整n_estimators,max_depth,max_features,min_samples_split,min_samples_leaf这几个参数
  2. XGBOOST
    xgboost一般调整n_estimators,learning_rate,max_depth,min_child_weight,subsample,colsample_bytree这几个参数
  3. Lightgbm
    ightgbm的很多参数和xgboost是一样的,主要对n_estimators,learning_rate,num_leaves,min_child_sample,subsample,colsample_bytree这几个进行调整
  • 3
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值