内评法的基本框架

内评法的由来

内评法,即内部评级法。2012年监管部门出台的《商业银行资本管理办法》的附件5《信用风险内部评级体系监管要求》对内部评级提出了模型基本规范,附件16《资本计量高级方法验证要求》对内部评级提出了模型验证要求。内评法的真正大面积实战应用,始于互联网金融业务的发展。发展到今天,尽管有些中小银行尚未真正应用,但从总体、趋势和理念看,内部评级已经是商业银行风险管理的核心,也代表着未来风险管理的发展方向。

内评法模型与传统风控的区别

内评法模型,从结果形式上包括两种:一是强规则策略,如资产负债率超过70%,拒绝;少数股东权益非零,明股实债概率大,拒绝,等等。二是综合评分模型。如资产负债率在30%-40%间,10分;财务成本率在5%以上,-5分,等等,将各指标加总,计算出一个综合评分。
对应的,传统风控,从结果形式上也包括三种:一是强规则策略,和内评法模型没有本质区别,只是内评法是根据实际数据,测算发现IV值过大(如0.5以上)的指标作为强规则,传统风控则是基于经验判断。二是综合评分模型。这点和内评法存在本质差异。内评法是根据严格的模型计算出分值的,在商业银行实战中,一般使用逻辑回归方法建模;是要符合统计检验标准的,要求就是《商业银行资本管理办法》附件16《资本计量高级方法验证要求》的“模型区分能力应采用不少于两种方法进行检验,包括监测累积准确曲线及其主要指数准确性比率、ROC曲线及AUC系数、Somers’D和KS检验结果等”。传统风控的综合评分,是专家判断,分值是专家判断得到的,没有对模型进行统计检验。统计检验是非常重要的,没有检验,说不定的你的模型是没有区分度的,是在起反作用。三是没有综合评分,只有一个准入和拒绝的结果,没有多大程度上作出准入和拒绝的概率,因此,也就没法大面积回检业务准入和拒绝当时的决策和策略的正确性,难以通过量化的形式支持决策和策略的调优,也没法随之定价和预警。

内评法模型模型构建之一:数据整理与清洗

内评法要采集大量数据,主要包括三类数据:一是Y值,也就是客户是违约还是正常。这里要注意一点,新客户不宜纳入模型,因为新客户风险暴露不充分,其Y值不准确,纳入模型反而形成干扰。二是X值,包括财务数据、工商登记数据(如注册时间长短、法定代表人及注册地址变更频率等)及一些行政部门产生的评价数据(如税务评级、行政处罚数据等),等等。三是客户性质数据,这是为了模型分组而采集的,比如,制造业和批发零售业,可能风险表现不同,需要构建不同的模型;再比如,有些类别的客户,风险是有托底的,把这些客户纳入,反而会扰乱模型。
在数据整理过程中,往往都需要转置,比如数据库系统中,一个客户、一个时间点的财报就是一张表,合并在一起,列依次为客户号、时间和金额,各行分别是资产、负债……,本质是各指标的一维表。我们整理后要形成一张宽表,各列依次是客户号、时间、资产、负债……,本质是各指标的二维表。这时,可以使用pivot函数,详见PYTHON的一维转二维
在数据清理过程中,对于一些有异常的数据,需要剔除,或者采用以均值替代等方法。

内评法模型模型构建之二:变量分箱

变量分箱是一件十分重要的工作。传统的多元统计、计量经济学教材上,是没有这个内容的,或者说,传统的多元统计,更希望变量是连续型变量。但在商业实践中是不合适的。一来,连续性变量的经济意义不强,比如年龄30和31岁,你非要认为,他们的违约率不同,这是不可接受的。二来,容易导致模型过拟合,预测能力差。
在PYTHON软件中,分箱通过函数cut实现,这个词汇很准确,切分,就是分箱。
分箱的标准是什么,分箱后的woe具有经济意义,每一箱都有一定数量的样本。
这里的WOE是一个非常重要的指标,贯串整个模型,是分箱后的坏客户占比与好客户占比之商的对数,反映各箱坏客户的占比。
在这里插入图片描述

data['Share Good'] = (data['All'] - data['Bad']) / (data['All'].sum() - data['Bad'].sum())     
data['Share Bad'] = data['Bad'] / data['Bad'].sum() 
data['WoE'] = np.log(data['Share Bad']/data['Share Good'])

内评法模型模型构建之三:变量筛选

分箱后,哪些变量入模,有一个严格的评价指标,就是IV。IV是WOE的均值。

在这里插入图片描述

data['IV'] = (data['WoE'] * (data['Share Bad'])-data['Share Good'] ).sum()

通常我们会选择 IV 值在 0.1~0.5 这个范围的变量。IV 值大于0.5,指标区分度极高,直接入模会导致其他变量被弱化,因此不适合入模。
变量筛选,还需要经过其他一些操作,核心是处理多重共线性,这个是需要多元统计理论知识的,也是个最难的地方,以后再详述。

内评法模型模型构建之四:建立模型

变量经过一系列筛选后,建模本身是比较简单的。使用LogisticRegression函数。
逻辑回归的概率密度函数是:
在这里插入图片描述
在建模时,需要注意三点:一是自变量要进行WOE转换,这是很多人无法理解的一个东西,大家一定要从前文所述WOE的本质和分箱的目的去理解。二是要将数据一分为二,分为测试集和训练集,以反映模型预测效果。三是模型要经过AUC和KS检验,以反映模型的区分度。

内评法模型模型构建之五:建立评分卡

我们都当过学生,学生总要考试,考试是通过分数体现的。回归模型也一样,将概率转换为分数。
在这里插入图片描述
所以就通过logic函数,将y值(p)和线性回归的参数结合在一起,因此叫逻辑回归!

内评法模型模型构建之六:内评应用

内评结果应用于贷前、贷后和考核。贷前,即应用于授信审批、贷款定价、额度管理和授信政策。贷后,即应用于风险预警,从而实现“四早”处置。考核即应用于拨备、资本和绩效管理。因此,如前述,内部评级是商业银行风险管理的核心。

更多内容,请关注微信公众号“风控学习笔记”。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值