评分卡模型

一、评分卡模型:

1、评分卡模型是常用的金融风控手段之一 风控,就是风险控制,我们采取各种措施和方法,减少风险发生的可能性,或风险发生时造成的损失

2、根据客户的各种属性和行为数据,利用信用评分模型,对客户的信用进行评分,从而决定是否给予授信,授信的额度和利率,减少在金融交易中存在的交易风险

3、按照不同的业务阶段,可以划分为三种:

贷前:申请评分卡(Application score card),称为A卡

贷中:行为评分卡(Behavior score card),称为B卡

贷后:催收评分卡(Collection score card),称为C卡

4、评分卡模型: 客户评分 = 基准分 + 年龄评分 + 性别评分 + 婚姻状况评分 + 学历评分 + 贷款申请次数

二、开发步骤

Step1,数据获取,包括获取存量客户及潜在客户的数据 存量客户,已开展融资业务的客户,包括个人客户和机构客户; 潜在客户,将要开展业务的客户

Step2,EDA,获取样本整体情况,进行直方图、箱形图可视化

Step3,数据预处理,包括数据清洗、缺失值处理、异常值处理

Step4,变量筛选,通过统计学的方法,筛选出对违约状态影响最显著的指标。主要有单变量特征选择和基于机器学习的方法

Step5,模型开发,包括变量分段、变量的WOE(证据权重)变换和逻辑回归估算三个部分

Step6,模型评估,评估模型的区分能力、预测能力、稳定性,并形成模型评估报告,得出模型是否可以使用的结论

Step7,生成评分卡(信用评分),根据逻辑回归的系数和WOE等确定信用评分的方法,将Logistic模型转换为标准评分的形式

Step8,建立评分系统(布置上线),根据生成的评分卡,建立自动信用评分系统

三、WOE编码:

1、Weight of Evidence,证据权重

是自变量的一种编码,常用于特征变换用来衡量自变量与因变量的相关性

B代表风险客户,G代表正常客户

对于某一变量某一分组的WOE,衡量了这组里面的好坏客户的占比与整体样本好坏样本占比的差异

2、IV(Information Value)

woe只考虑了风险区分的能力,没有考虑能区分的用户有多少

IV衡量一个变量的风险区分能力,即衡量各变量对y的预测能力,用于筛选变量

3、WOE和IV计算步骤:

Step1,对于连续型变量,进行分箱(binning),可以选择等频、等距,或者自定义间隔,对于离散型变量,如果分箱太多,则进行分箱合并

Step2,统计每个分箱里的好人数(bin_goods)和坏人数(bin_bads)

Step3,分别除以总的好人数(total_goods)和坏人数(total_bads),得到每个分箱内的边际好人占比margin_good_rate和边际坏人比margin_bad_rate

Step4,计算每个分箱的WOE

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值