20191224 Morning
1)PD 贷款的违约概率 --- 银行的A B C 卡
2) 一般而言 模型的AUC值超过80% 或者 KS值超过45%,需要对模型的解释性做详细的刻画,否则会被认为是不可靠的模型。
3)业务场景中的模型或者算法不一定追求100%的模型,需要的是不仅仅在当前数据集上100%效果,而是长期数据集上稳定的效果,是一个稳定的刻画,因此一般而言的一期开发是选择一些行内专家认为的稳定的变量或者分布稳定的变量来作为模型的特征。
4)比较细粒度的模型刻画的数据集划分可以选择:3-5月份的数据进行train-val数据集划分,然后在7-8月份的数据集oot上进行模型表征能力的刻画。对于序列数据的分析?
5)对于业务场景中模型的效果,无论好坏,寻找模型背后数据变量的可解释性。
6)一般的数据模型建立和数据分析的流程:
1.先将所有的特征(自变量)进行分布的刻画、观察、分析,选择较为稳定的特征(服从正态分布或者接近正态分布),而非是一些特殊值分布的变量,作为初期模型的自变量。
2.基于上述稳定的自变量,首先可以选择GBDT或者XGBoost等模型训练一个该任务的上线结果;
3.然后再利用常用的逻辑回归或者评分卡模型来进行风控模型的构建,对于每一版模型的效果进行解释。
4.如果条件允许,再根据后续的数据集进行模型效果验证。
20191224 关于信用风险控制(信用风控)中的一些专业术语的认识:
- KS值:
- 2004年的巴塞尔协议提出新的IRB协议(内部信用评级方法)中允许银行采用内部数据估计风险计量参数,包括有:PD: 贷款违约率 + LGD: 违约损失率 + EAD: 违约风险暴露 + M:有效期 + 贷款风险溢价(=(PD+TR)*LGD)等。
- 行内常用的A卡、B卡 、C卡
- 风险策略:
风险策略是由很对信审风控规则所组成的一个用以实现金融机构风险控制目标的一个规则集合。
进件规则:主要作用是用来定义信贷产品特定的目标客群,比如房屋抵押贷款的进件规则至少是客户有房,助学贷款的进件规则是客户至少是学生,手机分期贷款至少是客户在买手机。
反欺诈规则:一般分为申请欺诈和交易欺诈。交易欺诈多发生在支付、信用卡及类信用卡等产品中。一般贷款类产品主要涉及到的是申请欺诈;申请欺诈主要分为以下四类:
身份冒用:被第三方冒用身份
恶意骗贷:自己不计后果的行为
资料造假:通过资料造假提升自己获得授信的可能性
用途篡改:部分类型的信贷是指借款用途,如果私自改变借款用途,就是用途篡改欺诈。
严拒规则:信贷机构完全不能容忍或者防止合规性风险的规则。例如部分机构会有:if age<18,then reject类似的规则。
客群判定:凡是我们认为可以区分不同客群的规则,都可以归到这一类中。比如进件渠道、用户特征、历史行为等。客群规则有很多细分的地方。目前业内常用的是按照进件渠道或者明显的行为差异或区分风险的能力来做客群分类。怎样的客群分类最有利于风险判断或建模?
可变规则(Soft Rule):这类规则是整个风险规则中调整频率比较高的一类规则,仅次于反欺诈和评分规则。例如可以选择:手机号的入网时长、目前工作单位的工作时间、最近一段时间内的信贷申请次数、当前授信总额。
评分规则:此处便是需要建立一个的信用评分引入整个规则体系,优化评分规则有以下益处:
*降低存量规则授信人群的逾期率
*在不提高逾期率的前提下,提高通过率