智能风控:风控应用之额度

1、常规授信策略(基于申请评分)

绝大多数信贷从业者的业务经验:用户A风险比较高,授信额度就低一些,用户B信用好,授信额度就高一些?其实这个说法不完全成立,用户A风险高,是有一定违约率的,提高与违约率对应的利率就能确保整体收益,我们可以从利润角度考虑:

期望利润=(1-P)*贷款收入-违约概率P*贷款损失

这里的违约概率指的是风险程度,贷款损失主要集中在贷款本金(授信额度),贷款收入主要和利率挂钩,故而要想期望利润大于0时,当odds很小时需拒绝用户申请,当odds较小即用户风险较高,需提高利率同时适当降低授信额度区间(风险等级对应的额度区间)和额度调整系数。当用户A和B偿债能力相差较大时,授信额度差距也会比较大,这里面的风险只能作为额度调整系数,授信额度本身还是要依据用户的偿债能力。

传统的授信额度策略主要以规则、专家经验和简单模型为主,需要多人参与,维护起来较为复杂。而且,一般的授信额度模型由风险和用户负债能力来确定,维度比较单调,缺乏精确性和灵活性。

往往在实际业务场景中,我们很难预测精确的违约概率及申请评分,评分策略通常根据实际业务情况灵活制定。授信策略以评分模型为基础,结合经济稳定性和经济能力等指标,对借款人的还款能力和还款意愿进行综合评价和分层,实现基于信用风险的差异化授信。具体流程为:设定评分准入条线、设定额度上下限(盖帽额度H、托底额度F)、划分等级系数、计算基础额度、计算最终额度。具体流程图:

1.1基于用户的经济能力和稳定性授信

将评分等级和经济稳定性相结合,构建决策矩阵,确定每个细分客群的系数等级,系数等级结合借款人的经济能力,计算得出基础额度

经济稳定性和经济能力分别代表借款人收入的稳定程度和高低水平,实际应用中,可以选择含义相近,效果相当的指标,或由多个指标综合计算(行业,职位,社保、公积金、税务、银联等数据或有三方数据源可直接提供),获得用户的经济能力和消费水平相关的变量有很多,在确定系数等级及基础额度时,可以不拘泥于经济能力和经济指标两种指标(例如:信用评分等级、收入水平与用户的消费能力,构建决策矩阵)。最终计算额度为:

最终额度=min⁡(max⁡(基础额度,托底额度),盖帽额度)

举例说明:由上图可知,准入线为500分,低于500分,直接归于E等级,构建评分等级和经济稳定等级的决策矩阵,用于划分系数等级,矩阵中每个细分客群的数量和占比都可以测算,相应的系数等级也可以根据实际业务情况灵活调整,假设某申请人的模型评分为680分,经济稳定性指标为稳定,则对应的系数等级为“B 30%”。盖帽额度为H=30w,托底额度为F=3000,申请用户的年收入为20w(即经济能力),则此用户的基础额度为B=20w*30%,处于托底额度与盖帽额度之间,故而最终额度=基础额度=6w。

1.2 基于用户DTI或月负比授信

将信用评分等级与DTI,构建决策矩阵,确定每个细分客群的系数等级,系数等级结合违约概率,此时用户的基础额度=月(年)收入(可支配收入),计算得出最终额度:

DTI=月(年)均债务总额(信用贷款、车贷、房贷、担保贷款等)/当月收入

最终额度=月(年)收入(可支配收入)*风险因子f

首先我们需要先计算出风险因子,由于实际业务中,模型效果很难做到精确性判别,故而调整系数f可根据申请评分,行业、学历、职位、消费能力,资产情况来调整系数,月收入也可根据所在行业,职位,公司性质,资产情况进行调整。月收入不超过负债的22倍,各大银行对于C端客户的收入负债比率接受程度不同,但不会超过80%。

以上为常规授信策略,需结合实际业务和专家经验综合判断,基于用户的信用风险、偿债能力、消费水平等维度来做授信核额模型。

2、额度授信模型

授信额度由多个因素共同决定,为了更加精确地反映不同因素对于授信额度的作用,提出建立基础授信额度和额度调整因子,并对每个调整因子单独建立模型,从而能够更加精确地量化不同因素在授信额度中的作用。

训练数据集通常来源于历史信贷用户数据。在训练时,通常需要指定数据集中的输入变量(输入参数)和目标变量(目标变量)。由于基础额度模型主要的任务是根据用户的基本属性来衡量用户的基本贷款需求,而且,为了避免和额度调整因子模型的相关性过强,在基础额度模型的训练过程中,采用较为基础或单纯的输入变量进行训练。更优选的,可以采用包括基本属性数据和资金资产类的指标作为输入变量来训练模型,而在训练其他的额度调整因子模型时,输入变量不包括资产或资金类指标。

为了保证基础额度模型和各额度调整因子模型之间的相关性不至于过大,一方面,用于训练所述各额度调整因子模型的数据集的输入变量可以不包括资产或资金类指标,另一方面,用于训练所述基础额度模型的数据集输入变量和各额度调整因子模型的各数据集的目标变量之间的相关系数可以控制为低于预定阈值。可以通过测算,将所述阈值控制在0 .2至0 .4之间。

基础额度模型在训练时,选择信用较好的、无逾期的金融用户数据,基本属性数据例如是用户的年龄、性别、学历、职业等注册信贷产品时提交的基本信息;资本资金数据可能包括收入、负债、固定资产、月均消费额、信用卡额度等。并将基础数据和资本资金类指标作为输入变量,授信额度数据作为目标变量。而在动支因子模型中,采用基础数据作为输入变量、动支类指标作为目标变量进行训练;在逾期因子模型中,采用基础数据作为输入变量、逾期类指标作为目标变量进行训练。具体建模方法不再阐述,流程见图:

动支评分表示的是模型给出的该用户的动支概率,衡量用户的资金饥渴程度,例如生成用户7天内动支的概率。该评分可以是在0和1之间,越大表示该用户越有可能在7天内动支。

对于逾其因子模型,当其接收到一个新用户的数据时,其首先生成的是一个逾期评分。该逾其评分表示的是模型给出的该用户在动支后逾期的概率,衡量用户的信用风险。例如生成用户逾期超过30的概率。

最终的授信额度公式为:

授信额度=基础额度*动支因子*逾期因子

授信额度=基础额度+动支基础额度*动支因子+逾期基础额度*逾期因子

3、车贷产品额度授信模型

车贷类公司核心是风险控制,而个人授信评分则是风险控制的核心。目前常见的是通过违约模型来构建个人授信评分卡,基于从银行等机构获取的信息,对用户的个人信用评价,根据用户的个人信用评价确定贷款额度。

但从银行等机构获取的信息,对用户的个人信用评价显然不是全面的,不能精准的定位客户,这种评价方法对于指定的借款原因没有针对性,会导致最后的评分有失水准,对借贷公司造成不必要的经济损失。举例来说如果一个用户资金信用良好,但是该用户的驾驶行为差,会很容易出现交通事故,不仅对自身安全造成极大威胁同时也会对车贷公司造成不必要的经济损失。(各类产品要基于用户的核心点来考虑授信定价问题,其主要风险特征作为补充点)我们以个人风险做为核心点确定贷款额度,基于驾驶行为作为第二核心来综合评价客户的贷款额度

3.1建立个人信用评分模型

常见的我们利用辑回归算法,逻辑回归 (logistic) 是一种广义线性回归 (generalized linear model) ,因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有w ′x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将 w ′x+b作为因变量,即y=w ′x+b,而logistic回归则通过函数L将w ′x+b对应一个隐状态p,p=L(w ′x+b) ,然后根据p与1-p的大小决定因变量的值。

常用数据为:信贷数据可以是:银联数据,互联网行为数据,舆情数据等。举例来说,银联数据可以是用户是否有贷款记录,是否有借贷逾期记录等;互联网行为数据可以是用户在网站上发生的所有行为;舆情数据可以是舆情因变事项发生、发展和变化过程中,民众所持有的社会态度。

具体做法不在阐述,建立评分系统,可以根据分数的大小分为多个分数段,每个分数段分别对应优,良,差,极差四个等级,授信分数表示了用户的个人信用风险,用于评价用户的个人消费贷授信额度。其公式为:

其中,所述score_0为已知或假设的基础分值;所述X为已知或假设的所述好坏样本比率;所述PDO为已知或假设的所述好坏样本比率翻倍的分值。其中好坏样本比率为好客户(没有发生或较少发生个人信用逾期的情况)与坏客户(将常发生个人信用逾期,或长时间逾期)个数的比值

3.2 建立驾驶信用度评分模型

息包括N类危险驾驶行为数据,驾驶授信分数用于评价所述用户的驾驶信用度,N为大于1的整数,根据用户的危险驾驶行为数据,确定授信分数,能够评估用户的驾驶安全风险。

N类危险驾驶行为数据,可以包括:N类危险驾驶行为类型数据和发生所述N类危险驾驶行为对应的时间数据,其中可选的,N类危险驾驶行为类型数据可以包括:平均油耗、急变速报警、怠速累计时长、超速报警、里程最高速度、超速时长等可直接或间接根据车载设备检测的危险驾驶行为信息;可选的N类危险驾驶行为类型数据,也可以包括:交通系统中的醉驾信息,违法停车信息,超员超载信息等无法直接或间接根据车载设备检测的危险驾驶行为信息。可以理解的是N类危险驾驶行为类型数据也可以是,能够获得的所有危险驾驶行为信息,包括可直接或间接根据车载设备检测的危险驾驶行为信息和无法直接或间接根据车载设备检测的危险驾驶行为信息。

具体建模方法不再阐述,确定用户的N类危险驾驶行为数据中的第j类危险驾驶行为的授信分数score_2j ,可以包括:通过对N类危险驾驶行为数据,统计四分位点分布来计算第j类危险驾驶行为的授信分数score_2j。举例来说:可以对于第j类危险驾驶行为的次数采取从0-7和大于7的9个区段,随着危险驾驶行为次数的增加,第j类危险驾驶行为的授信分数score_2j的分值逐渐减小,大于7时score_2j的分值设为最低的-5,等于0时score_2j的分值设为最高的25,此时第j类危险驾驶行为的授信分数score_2j分数越高,第j类危险驾驶行为次数越少,驾驶行为越好。

3.3 建立综合评分授信模型

通过对借贷人各项常见的危险驾驶行为指标进行评分,再与其个人授信额度评分相结合,这种结合驾驶行为和个人授信行为两种评分机制,能更直观和准确地给出其综合授信分数,会更好地适用于个人消费贷中的车贷方面。其公式:

score_1为所述个人信用授信分数,score_2为所述驾驶行为授信分数,δ为预设阈值,综合授信分数score用于确定用户的车贷授信额度。综合授信分数用于确定所述用户的授信额度包括:当综合授信分达到标准值时,综合授信分数越高,用户获得的授信额度越大或者用户获得额度的机会越大;或者,当综合授信分数不到标准值时,不给予用户授信额度。

在实际业务场景中,可适当调整预设阈值δ大小。举例来说:当多个个人信用授信分数所在的分数段对应优级的用户同时申请汽车贷款时,可以适当减小预设阈值δ,使得在确定综合授信分数时,更考虑用户的驾驶行为授信评分的影响。

4、额度调整

各个产品的核额模型核心点不一样,例如税银贷基于税务数据和财务报表,企业和个人信用评分为辅来构建额度模型,一些产品也可以基于职业社交、行为类等软信息、收入数据、消费数据等硬信息来做核额模型,其核心还是用户的偿债能力。

一般根据客户的贷后行为表现以及还款情况,做出额度调整的策略,以求得更大的收益,针对循环贷产品,通常会根据用户行为评分B卡的结果和额度使用率做额度调整策略,这里的行为评分指的近一年用户还款记录及行为表现来构建的,不会参与决策,只会基于行为评分做出相对应的策略调整,包括调整额度,改变营销手段等等,如果某用户的额度使用率很低,即使信用状况再好,调额也无法带来盈利空间,故而对于额度使用率低的用户,通常都会采用降低或者保持的调整策略。

注:给大家推荐一本关于机器学习的书,比较实用,机器学习是计算机科学与人工智能的重要分支领域. 本书作为该领域的入门教材,在内容上尽可能涵盖机器学习基础知识的各方面. 全书共16 章,大致分为3 个部分:第1 部分(第1~3 章)介绍机器学习的基础知识;第2 部分(第4~10 章)讨论一些经典而常用的机器学习方法(决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习);第3 部分(第11~16 章)为进阶知识,内容涉及特征选择与稀疏学习、计算学习理论、半监督学习、概率图模型、规则学习以及强化学习等. 每章都附有习题并介绍了相关阅读材料,以便有兴趣的读者进一步钻研探索。

  • 27
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值