信贷风控---评分卡
信贷风控评分卡(申请评分卡、行为评分卡、催收评分卡)的理论及代码实现,机器学习用于评分卡模型的建立以及组合模型用于评分卡的建立
路易三十六
Money Never Sleep
展开
-
(信贷风控十六)组合评分卡模型
组合评分卡模型本篇文章主要总结以下内容组合模型的概念 常见结构的评分组合模型 单一模型选择需要什么条件 串行结构组合模型实例 并行结构组合模型实例组合模型的概念常见结构的评分组合模型串行结构组合模型实例需要注意的是,一般工作中会把GBDT、神经网络、深度学习排在前面(因为精度高),逻辑回归、决策树放在后面并行结构组合模型实例...原创 2019-03-18 22:39:28 · 2160 阅读 · 0 评论 -
(信贷风控十五)评分卡分数切分、授信额度与利率定价
(十五)评分卡分数切分、授信额度与利率定价文章主要内容分数如何切分才能达到最优的效果 如何利用评分卡分数来制定授信额度 评分卡分数如何影响产品利率定价 如何计算评分卡下每个特征对应的得分下图是通过模型构建得出客户所对应的评分卡分数分数如何切分才能达到最优的效果使用卡方分箱的方法,至于把评分卡分数分成几个箱,看实际场景而定如何利用评分卡分数来制定授...原创 2019-03-17 14:05:54 · 8501 阅读 · 9 评论 -
拒绝推断
拒绝推断转载自微信号bigdatafengkong转载连接:https://mp.weixin.qq.com/s/RnQXPUBJe8-NUvtPDho0vw在做申请评分卡时,所使用的数据是审批接受的已知好坏状态的样本数据,然后用此评分对新的申请进行评估,这里会存在所谓"样本偏差"的问题,因为接受样本只是申请样本的一部分,此评分没有考虑拒绝样本的信息,在对总体申请进行评估时会有偏差。如...转载 2019-03-14 18:15:38 · 2603 阅读 · 0 评论 -
(信贷风控十四)深度神经网络模型用于评分卡模型(理论)
(十四)深度神经网络模型用于评分卡模型(理论)本篇文章主要讲解以下两个内容神经网络的概述 深度神经网络模型用于违约概率预测(代码实现看下一篇博客)神经网络的概述什么是人工神经网络神经网络算法的核心:计算的过程、连接的结构、评估的工作、纠错的反馈、疯狂培训(不断运行)人工神经网络的类型神经元的特征:并非简单的相加,有相应的输出函数学习规则:使得模型输出与标签尽...原创 2019-03-13 14:35:19 · 4590 阅读 · 1 评论 -
(信贷风控十三)GBDT模型用于申请评分卡模型python实现(代码实现)
(十三)GBDT模型用于评分卡模型python实现前一篇我们已经介绍了GBDT模型用于评分卡模型的原理(理论)https://blog.csdn.net/LuYi_WeiLin/article/details/88314746这篇博客附上GBDT模型用于评分卡模型python实现的代码(之前已经有一篇运用逻辑回归实现申请评分卡的文章https://blog.csdn.net/LuY...原创 2019-03-11 17:40:31 · 5223 阅读 · 5 评论 -
Vintage、滚动率、迁移率的应用
Vintage、滚动率、迁移率的应用转载自微信号bigdatafengkong转载连接:https://mp.weixin.qq.com/s/KefG_8krBBaFl0LCi2L2WA一、VintageVintage源于葡萄酒酿造,葡萄酒的品质会因葡萄生长的年份不同、气候不同而不同。Vintage分析是指评估不同年份的葡萄酒的品质随着窖藏时间的推移而发生的变化,并且窖藏一定年份后...转载 2019-03-10 16:55:26 · 1619 阅读 · 1 评论 -
(信贷风控十二)GBDT模型用于评分卡模型(理论)
GBDT模型用于评分卡模型本文主要总结以下内容:GBDT模型基本理论介绍 GBDT模型如何调参数 GBDT模型对样本违约概率进行估计(GBDT模型用于评分卡python代码实现请看下一篇博客) GBDT模型挑选变量重要性 GBDT模型如何进行变量的衍生GBDT模型基本理论介绍GBDT(Gradient Boosting Decision Tree) 又叫 MART(Mu...原创 2019-03-08 14:33:46 · 4979 阅读 · 1 评论 -
(信贷风控十一)随机森林在催收评分卡还款率模型的应用(python代码实现)
(十一)随机森林在催收评分卡还款率模型的应用(python代码实现)催收评分卡和申请评分卡和行为评分卡不太一样,一般申请评分卡和行为评分卡使用一个模型就可以了,但是催收评分卡由三个模型构成:(不同的模型功能目的不一样,其中失联预测模型是比较重要的)还款率模型 账龄滚动模型 失联预测模型这篇博客以还款率模型进行讲解,要讲解还款率模型,我们首先要了解一下随机森林模型基于回归树的随...原创 2019-03-06 14:36:21 · 6453 阅读 · 3 评论 -
信用风险计量模型汇总
信用风险计量模型汇总信用风险计量模型的基本技术路线是,利用借款者的特征指标和宏观经济变量,收集这些特征指标和宏观变量的历史数据,并将其应用于预测违约借款人与履约借款人。预测模型旨在评估未知借款者将来是否还款的信用价值,将潜在借款者的特征值输入模型,从模型中输出信用价值评估,从而可对潜在借款人进行信用评估。一般的评级方法可以分为专家经验判断法、参数模型和非参数模型。所谓的专家经验判断,就是相...转载 2019-03-01 15:29:29 · 2648 阅读 · 0 评论 -
信用风险计量模型简述
信用风险计量技术简述1.古典信用风险计量模型主观判断分析方法、财务比率评分方法、多变量信用风险判别方法(其中最有效,包括线性概率模型、Logit模型、Porbit模型、判别分析模型)评级方法:将信用状况分成不同等级,分别使用不同的信用政策。评分方法:对影响信用的不同因素确定不同的分值和权重,汇总计算出对应的信用评分。作为给予企业信用额度或贷款额度的依据。Z评分模型、ZETA评分模型。专...转载 2019-03-01 15:10:24 · 2773 阅读 · 0 评论 -
评分卡Bad rate单调性问题
评分卡Bad rate单调性问题文章转载自https://blog.csdn.net/shenxiaoming77/article/details/79548807Bad Rate: 坏样本率,指的是将特征进行分箱之后,每个bin下的样本所统计得到的坏样本率bad rate 单调性与不同的特征场景: 在评分卡模型中,对于比较严格的评分模型,会要求连续性变量和有序性的变量在...转载 2019-02-21 17:50:40 · 2711 阅读 · 0 评论 -
IV值区间与预测能力关系
IV值区间与预测能力关系IV值的全称是information value,中文的就是信息量或信息值,其主要作用就是当我们在用决策树或逻辑回归构建分类模型时对变量进行筛选。IV值就是衡量自变量的预测能力的大小,与其相似的还有信息增益、基尼系数等。计算方式:IV值区间与预测能力关系:但是IV不是越高越好的,当IV>1.2时候,可能分箱不好或者存在因果倒置关系...原创 2019-01-21 15:16:45 · 10197 阅读 · 0 评论 -
KS值和AUC值的关系
KS值和AUC值的关系要弄明白ks值和auc值的关系首先要弄懂roc曲线和ks曲线是怎么画出来的。其实从某个角度上来讲ROC曲线和KS曲线是一回事,只是横纵坐标的取法不同而已。拿逻辑回归举例,模型训练完成之后每个样本都会得到一个类概率值(注意是类似的类),把样本按这个类概率值排序后分成10等份,每一份单独计算它的真正率和假正率,然后计算累计概率值,用真正率和假正率的累计做为坐标画出来的就是RO...转载 2019-01-21 11:41:51 · 5318 阅读 · 1 评论 -
(信贷风控十)催收评分卡的介绍
(十)催收评分卡的介绍评分卡可分为申请评分卡(A卡)、行为评分卡(B卡)、催收评分卡(C卡)。不同的卡使用场景不一样,A卡用于贷前申请环节,用来区分客户好坏;B卡用于贷中环节,根据观察行为预测未来一段时间发生逾期/违约的概率;C卡主要用于贷后环节,这篇博客来总结一下C卡相关的知识点。催收工作介绍要学习催收评分卡,首先要先了解一下信贷客户管理的周期其实对于逾期,不能一棍子打死,逾...原创 2019-02-28 11:53:49 · 13686 阅读 · 1 评论 -
(信贷风控九)行为评分卡模型python实现(详细代码+注释+讲解)
(九)行为评分卡模型python实现(详细代码+注释+讲解)浅谈行为评分卡我们知道行为评分卡只要用在信贷的贷中环节,贷中指的是贷款发放之后到期之前的时间段,其实行为评分卡和申请评分卡在实现上没有太大的差别,主要是数据集不一样。因为前一篇博客已经介绍过行为评分卡,这里就不过多去讨论了,主要以代码为主行为评分卡建模步骤数据预处理 特征衍生 特征处理与筛选 变量分箱 ...原创 2019-02-27 14:49:35 · 13215 阅读 · 37 评论 -
(信贷风控八)行为评分卡模型(B卡)的介绍
(八)行为评分卡模型(B卡)的介绍在信贷业务中,评分卡分为三种:申请评分卡(A卡) 行为评分卡(B卡) 催收评分卡(C卡)本篇我们来学习一下行为评分卡(B卡),首先什么是行为评分卡呢,行为评分卡的使用场景以及目的,适用的信贷产品?其中特别注意一下,不适合先息后本的信贷产品,因为每个月的违约概率不一样,不好预测观察期和表现期学习行为评分卡之前,要了解一些概念,...原创 2019-02-24 22:45:56 · 24105 阅读 · 5 评论 -
(信贷风控七)申请评分卡模型Python实现(图文+代码实现)
(七)申请评分卡模型Python实现(图文+代码实现)贷前准入环节流程图大致如下为什么需要建立评分卡?所有的模型一定是服务于业务的,那么业务上到底出现了什么问题,需要用到评分卡模型去解决呢?我们先从金融机构传统定价模式说起。我们知道银行将钱借出去是要收取利息的,那么收取多少利息是合理的呢?利息的本质是租金,银行借钱给客户,客户获得了一定时间内这笔钱的使用权,从而需要支付租金...原创 2019-02-24 17:24:31 · 18018 阅读 · 31 评论 -
(信贷风控六)评分卡知识查漏补缺
(六)评分卡知识查漏补缺制作评分卡时候,做变量相关性应该在哪一个步骤?在变量WOE编码之后,因为变量可能在WOE编码前存在相关性,不过编码过后就不存在相关性了;同理有一些变量在WOE编码前不相关性,但是WOE编码后相关了,所以做变量相关性分析,在WOE编码过后,带入模型之前合适IV值是越高越好吗?一帮来说,变量IV小于0.02就不要带入模型了,但是IV>1.2过高,这...原创 2019-02-19 11:58:20 · 1766 阅读 · 0 评论 -
(信贷风控五)评分卡模型的评价标准
首先我们回顾一下评分卡模型的制作步骤数据预处理 变量衍生构造 变量分箱 变量挑选 模型参数估计 模型校验 概率转换为分数这篇博客我们主要来讨论一下评分卡模型的评价标准,主要有以下三个方面模型的区分度 模型的准确度 模型的稳定性下面我们一一从这三个方面来讨论一下模型的评价标准模型的区分度评分卡模型的结果需要能对好、坏人群给出一定的区分度,常用方法(在...原创 2019-02-16 16:32:45 · 4889 阅读 · 0 评论 -
(信贷风控四)逻辑回归模型在申请评分卡中的应用
(四)逻辑回归模型在申请评分卡中的应用本遍博客主要讲解以下内容:逻辑回归描述 变量选择的方法(知识扩展) 带权重的逻辑回归模型逻辑回归描述伯努利分布说的是每一个客户逾期概率相同的情况,但是现实生活中,往往不同的客户逾期的概率往往不同,与一些特征有关。假设我们收集到很多特征,可以用线性函数来拟合逾期概率吗?我们看到其缺点,首先概率无解,其次,把现在的P代入对数似然函...原创 2019-01-31 09:58:20 · 3411 阅读 · 0 评论 -
(信贷风控三)申请评分卡中的数据预处理和特征衍生(下)
申请评分卡中的数据预处理和特征衍生(下)在上一遍申请评分卡中的数据预处理和特征衍生(上),我们主要讲解了构建信用风险类型的特征 特征分箱 WOE编码也就是对应图中(数据预处理、特征构造)这篇文章我们主要讲解特征选择,要学习特征选择,就要学习以下的知识点特征信息度的计算和意义 信用风险中的单变量分析和多变量分析特征信息度的计算和意义在申请评分卡这一块...原创 2019-01-24 22:56:39 · 2822 阅读 · 0 评论 -
(信贷风控二)申请评分卡中的数据预处理和特征衍生(上)
申请评分卡中的数据预处理和特征衍生本章文章主要讲解以下内容构建信用风险类型的特征 特征分箱 WOE编码构建信用风险类型的特征在我们运用模型之前,我们首先要进行特征工程,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。(下图引用了一幅图片h...原创 2019-01-21 15:12:08 · 4816 阅读 · 2 评论 -
(信贷风控一)互联网金融业申请评分卡的介绍
互联网金融业申请评分卡的介绍本文主要讲解以下知识点信用违约风险的基本概念 申请评分卡的重要性和特性 贷款申请环节的数据介绍和描述 非平衡样本问题的定义和解决方法信用违约风险的基本概念什么是信用违约风险?交易对手未能履行约定契约中的义务而造成经济损失的风险,即受信人不能履行还本付息的责任而使授信人的预期收益与实际收益发生偏离的可能性,它是金融风险的主要类型。业界常用衡量信...原创 2019-01-20 14:50:10 · 5198 阅读 · 1 评论