信用风险评级模型的开发
文章平均质量分 84
小力丸
数据分析,94年,摩羯座,软妹子
展开
-
信用标准评分卡模型开发及实现
一、信用风险评级模型的类型信用风险计量体系包括主体评级模型和债项评级两部分。主体评级和债项评级均有一系列评级模型组成,其中主体评级模型可用“四张卡”来表示,分别是A卡、B卡、C卡和F卡;债项评级模型通常按照主体的融资用途,分为企业融资模型、现金流融资模型和项目融资模型等。 A卡,又称为申请者评级模型,主要应用于相关融资类业务中新用户的主体评级,适用于个人和机构融资主体。 B卡,又称为行为评级模型原创 2017-08-03 02:07:58 · 80617 阅读 · 6 评论 -
评分卡模型开发-用户数据缺失值处理
在我们搜集样本时,许多样本中一般都含有缺失值,这种情况在现实问题中非常普遍,这会导致一些不能处理缺失值的分析方法无法应用,因此,在信用风险评级模型开发的第一步我们就要进行缺失值处理。缺失值处理的方法,包括如下几种。 (1) 直接删除含有缺失值的样本。 (2) 根据样本之间的相似性填补缺失值。 (3) 根据变量之间的相关关系填补缺失值。 直接删除含有缺失值的样本时最简单的方法,尤其是这些样本所原创 2017-08-02 22:51:11 · 11955 阅读 · 8 评论 -
评分卡模型开发-用户数据异常值处理
缺失值处理完毕后,我们还需要进行异常值处理。异常值是指明显偏离大多数抽样数据的数值,比如个人客户的年龄大于100时,通常认为该值为异常值。找出样本总体中的异常值,通常采用离群值检测的方法。 离群值检测的方法有单变量离群值检测、局部离群值因子检测、基于聚类方法的离群值检测等方法。由于本文采用的样本总体GermanCredit已经进行了数据预处理,即已经做了缺失值和异常值处理,因此,我们以随机产生的样原创 2017-08-02 23:09:32 · 8853 阅读 · 0 评论 -
评分卡模型开发-数据集准备
在缺失值和处理完成后,我们就得到了可用作信用风险评级模型开发的样本总体。通常为了验证评级模型的区分能力和预测准确性,我们需要将样本总体分为样本集和测试集,这种分类方法被称为样本抽样。常用的样本抽样方法包括简单随机抽样、分层抽样和整群抽样三种。 简单随机抽样:smp1<-sample(nrow(GermanCredit),10,replace=F)样本集可表示为:train_data=GermanC原创 2017-08-02 23:18:33 · 8543 阅读 · 0 评论 -
评分卡模型开发-定量指标筛选
模型开发的前三步主要讲的是数据处理的方法,从第四步开始我们将逐步讲述模型开发的方法。在进行模型开发时,并非我们收集的每个指标都会用作模型开发,而是需要从收集的所有指标中筛选出对违约状态影响最大的指标,作为入模指标来开发模型。接下来,我们将分别介绍定量指标和定性指标的筛选方法。library(InformationValue)library(klaR)data(GermanCredit)trai原创 2017-08-02 23:40:04 · 16565 阅读 · 2 评论 -
评分卡模型开发-定性指标筛选
library(InformationValue)library(klaR)credit_risk<-ifelse(train_kfolddata[,"credit_risk"]=="good",0,1)#将违约状态变量用0和1表示,1表示违约。tmp<-train_kfolddata[,-21]data<-cbind(tmp,credit_risk)data<-as.data.fram原创 2017-08-03 00:02:31 · 10987 阅读 · 0 评论 -
评分法模型开发-WOE值计算
对入模的定量和定性指标,分别进行连续变量分段(对定量指标进行分段),以便于计算定量指标的WOE和对离散变量进行必要的降维。对连续变量的分段方法通常分为等距分段和最优分段两种方法。等距分段是指将连续变量分为等距离的若干区间,然后在分别计算每个区间的WOE值。最优分段是指根据变量的分布属性,并结合该变量对违约状态变量预测能力的变化,按照一定的规则将属性接近的数值聚在一起,形成距离不相等的若干区间,最终得原创 2017-08-03 00:12:47 · 22777 阅读 · 2 评论 -
评分卡模型开发-基于逻辑回归的标准评分卡实现
由逻辑回归的基本原理,我们将客户违约的概率表示为p,则正常的概率为1-p。因此,可以得到: 此时,客户违约的概率p可表示为: 评分卡设定的分值刻度可以通过将分值表示为比率对数的线性表达式来定义,即可表示为下式: 其中,A和B是常数。式中的负号可以使得违约概率越低,得分越高。通常情况下,这是分值的理想变动方向,即高分值代表低风险,低分值代表高风险。 逻辑回归模型计算比率如下所示:原创 2017-08-03 01:05:01 · 55125 阅读 · 11 评论 -
评分卡模型开发-主标尺设计及模型验证
在第五步中开发的信用风险评分卡模型,得到的是不同风险等级客户对应的分数,我们还需要将分数与违约概率和评级符号联系起来,以便差异化管理证券公司各面临信用风险敞口的客户,这就需要对证券公司各面临信用风险敞口业务中的个人客户开发一个一致的主标尺。最容易理解、最容易操作的方式就是根据违约概率从低到高分为不同的区间,这就相当于把违约概率这把尺子标上刻度,用这把尺子可以把证券公司需承担信用风险敞口的不同业务中的原创 2017-08-03 01:24:32 · 8610 阅读 · 0 评论 -
评分卡上线后如何进行评分卡的监测
我们的评分卡上线后,如何对评分卡的效果进行有效监测,监测哪些指标,监测的指标阈值达到多少我们需要对现有评分卡进行调整更新?这是我们在评分卡上线后需要持续性监测、关注的问题,今天就来跟大家分享一下互金行业评分卡监测的常用手段。1. 模型稳定性包括评分卡得分分布的PSI(Population Stability Index),原创 2017-10-26 17:48:34 · 12524 阅读 · 4 评论