03、信贷业务中的风控识别:金融风控业务流程5步走!这些是核心!

图片

今天我们将一起探讨一个既专业又实用的领域—风控业务。在这个充满变数的时代,掌握风控知识就如同掌握了一把金钥匙,能帮助你在金融等领域游刃有余,不再因为一些基础概念而迷茫。

风控,简单来说就是风险控制,它涉及到对潜在风险的识别、评估、监控和应对。在金融领域,风控是保障资金安全、提高投资回报率的关键环节。了解风控业务,不仅能帮助我们规避潜在风险,还能让我们的投资决策更加明智、稳健。

图片

在接下来的时间里,我们将一起深入探讨风控业务的核心要素、实际应用场景以及背后的逻辑原理。无论你是金融从业者、投资者,还是对风控领域感兴趣的朋友,相信这次分享都能为你带来全新的视角和启发。

正文:

看过之前文章的都知道,风控一般分为两个步骤:风险识别,风控策略。风控效果=风控识别效果*风控策略的力度;风控识别的效果决定了整体的风控效果,而风控策略则更注重平衡风险和收益。力度大了影响到正常的行为,力度小了则风险无法控制。那么我们就从风险识别和风险策略这两个维度说说风控那些事。

风控之别:识别各种风险

风险识别,注重的是识别各种风险,并且给风险打上一定的权重,告知风险类型,风险等级等。通常我们会基于用户和行为两个大的维度去进行识别。

从用户维度识别:

我们对每一个用户的信息进行两种打分,假设我定义为防守分值(就是哪些用户容易被骗)和攻击分值(就是哪些用户容易骗人)。通过两个评分值来判断用户容易被骗的程度和容易骗人的程度,之后进行策略调整;整体的策略就是收集尽可能多的用户相关数据,使用风险模型,针对这类用户进行打分,然后对于不同的分值的用户在不同的场景下使用不同的策略。如分值超低的用户在进入将要唤起交易的时候,强制观看防骗内容甚至要求答题等。

从用户行为识别:

来判断用户当前的行为风险(包含容易被骗,带有攻击行为等),然后针对用户的各种行为来进行打分,判断行为在某些场景下的风险值,以及这个行为的总风险值情况。

风险识别需要识别风险类型和风险等级,当然识别的越广越准确越好,那么识别后怎么去做呢?那么我们下面就聊聊风险识别后的风控策略,风控策略:是针对不同类型不同等级的风险,使用不同的产品策略去进行控制,从而减少风险发生;好的风控识别决定你可以控哪些,而好的风控策略则决定你业绩和安全的平衡点。

图片

01

最开始的信贷风控是怎么做的?

首先大家先理解一下最开始的信贷风控,我们是怎么做的呢?

你们先想象下这个画面:有一个西装革履的业务员,然后可能头发也抓的很好看。然后他会跟来贷款的这个人面对面的坐在那里聊天,审核他的资料,一页一页的翻,然后凭借他自己多年的一个风控经验。就准确的识别出对面的人会不会还钱,会不会来把钱带走了之后人间蒸发?

然后来贷款的人,他也会精心准备自己的材料,穿上自己最好看的衣服,正襟危坐的跟对面的人谈笑风生,生怕对面的人就是怀疑自己的这种经济实力,或者说你一不小心露出了某种猥琐的气质啊,可能就会被当成骗贷的。

这就是最早的风控信审人员,他是看材料,聊天,察言观色的,然后来判断你是不是坏人。后面互联网时代,最开始的风控模型主要是通过一些数据分析的手段来帮助老业务员们,就是更好的去做决策。延续至今呢,就是我们通常用作规则的那些手段。再后来各种各样的人工智能热潮,金融领域的话也开始搞各种的机器学习模型,机器学习反击杀。

图片

大家知道AI的目的就是为了解放我们的一个劳动力。像风控模型,解放的就是之前提到的那一批信审的老大哥,在中小额贷款上的一个劳动力。有时候大部分的公司一天的业务进件量都可以达到几万。人工审核怎么可能审的过来?就必须要去做自动化的风控,有的人叫大数据风控为AI金融风控,不管你怎么叫,它本质上都是一个"二分类的模型",它的作用就是可以同时的处理掉几十万或者几百万人的一个贷款请求;

1.1、人工审核

在信贷风控的初期,主要依赖的是人工审核。这种方式,无疑是对审核员的经验和直觉的一次大考。在那些日子里,每一个审核员都如同一位智者,凭借自己的经验和直觉,去判断每一笔信贷的风险大小。[人审]的方式虽然原始,但在当时却是信贷风控的主要手段。

1.2、吃业务经验

贷风控初期的一个重要问题是,它依赖于吃业务经验。这就像是一场没有硝烟的战争,如果没有足够的经验,就无法在风险的大潮中稳住阵脚。因此,那些经验丰富的审核员成为了信贷风控的宝贵财富。

1.3、不能大批量处理,效率低下

人工审核的方式有一个致命的缺陷,那就是无法大批量处理,效率低下。在信贷业务飞速发展的时代,这种效率低下的问题愈发凸显。它像一道无形的枷锁,限制了信贷风控的效率和规模,使风控工作难以应对大规模的业务需求。

1.4、不适用于移动互联网时代的金融场景

传统的信贷风控方式在移动互联网时代的金融场景中,更是显得捉襟见肘。移动互联网的快速发展,使得信贷业务变得更加快捷和灵活,但同时也带来了更多的风险。传统的风控方式已经无法满足快速、大规模的风险控制需求,急需一种更加高效和智能的风控方式来取而代之。

图片

02

建模的概念

建模就是构造一个数学公式,能将我们手上有的数据输入进去,通过计算得到一些预测出来的结果。比如大家大学中学习的线性回归,就是最简单的建模过程。

风控模型最原始的思路就是输入一个用户的信息,得到这个人是 “会还钱” 还是 “不会还钱”。这就是个二分类问题。而评分卡模型其实就是希望能将一系列的个人信息输入模型,然后得到一个用户的还款概率。概率越大,评分越高,越容易还钱。概率越小,评分越低,越容易跑路。

典型例子就是芝麻信用分。那为什么一定要应射成某种分数呢?它这个分数有什么用呢?它其实就是这个不还款的概率。概率映射过来的分越高,他就越有可能会还款,然后为什么一定要把它映射成分数呢?就是说我们有一个分数刻度的话,它是有好处的,例如我们可以随时根据业务需求调整通过率、更容易向用户解释他的信用评级、更容易向领导解释一个用户被拒绝的原因、更容易监控一个模型的效果等;

风控模型,其实本质上它是为了策略服务的。策略呢,就是对不同的人会给出不一样的政策模型的作用;比如我们按照这个评分的高低,把客户划分成abcd这样的四个区间,然后我们对不同的区域做不同的策略,通常就是会给评分高的这种区间的客户更高的额度更少的利息,然后对于这种预测信用差的客户,就会给他更高的这种利息来抵御一个风险。

图片

03

风控的流程

一个完整的风控模型体系应该是什么样子的呢?从风控流程的角度来看,信贷风控主要包括数据采集、反欺诈、策略制定、模型构建和催收等步骤。这每一个步骤都如同一道关卡,共同守护着信贷业务的安全。

图片

(图片来源于网络)

3.1、数据采集

数据采集,通常会涉及到埋点和爬虫技术,基本上业内的数据都大同小异。免费的运营商数据、和安卓可爬的手机内部信息(app名称,手机设备信息,部分app内容信息)、以及收费的征信数据、各种信息校验、外部黑名单之类的。还有一些特定场景的现金贷和消费金融会有自有的数据可供使用,比如阿里京东自己的电商数据、滴滴的司机数据、顺丰中通的快递数据等等。由于不涉及爬虫,这一块主要让大家理解一下都可以做些什么变量。

3.2、反欺诈引擎

反欺诈引擎主要包括两个部分,反欺诈规则和反欺诈模型。这里其实很少使用传统监督模型。涉及到的算法以无监督算法、社交网络算法、深度学习居多。大部分的公司都使用的是反欺诈规则,这也是主要提倡的。一个原因是欺诈标签不好得到,很难做监督学习的训练。还有一个原因是传统的机器学习对欺诈的检测效果很差。

因为所谓欺诈,就是一些黑产或者个人将自己包装成信用良好的用户,进行借款后失联或者拒不还钱。既然都伪装成了好客户,基于风控人员主观思考建立的统计模型,又怎么可能有好的效果。但是经过一段时间的实验,这一块其实用深度学习反而有意想不到的效果,基本思想可以理解为,简单评分卡解释性强,带来的坏处就是可以被逆向破解,而复杂模型的黑箱操作虽然解释性差,却有一定的安全性,尤其是搭配了在线学习等动态手段之后。反向破解的成本极高。此外还有很多算法诸如异常检测和知识图谱都在这一块有所应用。

3.3、规则引擎

规则引擎其实就是我们常说的策略,主要通过数据分析、挖掘手段以及一些监督、无监督算法,得到不同字段、各个区间的坏账率(badrate-坏人占比),找到最佳分段区间,然后得到筛选后信用较好的一批特定人群进行放款。这一块主要有单变量分析和一些关键指标的计算和监控,比如Rollrate、PSI、KS、AUC,等等。通常规则和模型是组合使用的,尤其在反欺诈场景中。

这个风控的规则,要从什么方向来考虑?每一家公司它一定都有一些什么样子的规则呢?我觉得一定都有四要素验证。要素验证是什么?要素验证,就是说姓名,手机号,身份证和银行卡。有很多公司啊,他们是专门做这种验证的;

我们查用户的各种外部数据征信,各种征信分,一般都是要提供用户的身份证和姓名。才能确定这个人。而我们放款的话,是直接放到银行卡里面的。然后通过我们的手机号去联系客户,所以说这四要素是非常重要的,一般的公司都会有四要素验证。哪怕你不是四要素验证的话,你可能也会有三要素验证或者二要素验证。

除此之外,一定有反欺诈规则。最简单的反欺诈。就是去买欺诈名单,就是那些数据公司的欺诈名单,然后放到自己的数据库里面。然后只要你的客户和刚刚的四要素其中有一项跟数据库里面的人匹配上了,那么这人就是个诈骗惯犯,直接拒绝掉!

3.4、风控模型

风控模型是机器学习在风控领域的主要体现。当然前面提到的反欺诈模型也是重点之一。主要是通过监督算法构建违约概率预测模型。但是因为实际业务中,是数据的质量并不是永远那么完美,这里通常我们会使用到深度学习、无监督、弱监督等等方法去辅助传统监督学习算法。

在风控领域,尤其是信贷风险管理中,A/B/C卡模型通常是指根据不同阶段的风险管理需求而设计的不同风控模型。虽然它们使用的底层算法可能相同或相似,但关键的区别在于所针对的风险表现变量(Y变量)以及应用场景。

A卡模型:通常指“审批卡”或者“准入卡”,应用于贷前阶段,当一个新客首次来申请的时候。我们肯定要有个申请评分卡。也就是我们常说的A卡,Application Card,用于决定是否批准客户的贷款申请。在这种情况下,模型基于历史数据训练,以预测客户未来可能出现的最大逾期天数作为违约风险的衡量标准。模型会考虑诸如客户历史信用记录、逾期行为等因素,通过最大化区分潜在优质客户和高风险客户的能力来优化模型性能。

B卡模型:也称为“行为卡”或“行为评分卡”,对于之前贷过款的,然后又来贷款的这种老客而言,我们还有行为评分卡,也就常说的b卡,Behavior卡。它关注的是贷中监控及早期预警。这里的Y变量可能是多期借款中客户逾期最严重的一次,用来识别已发放贷款的客户群体中哪些可能存在较高风险,从而及时采取干预措施,降低整体坏账率。

C卡模型:最后我们还会有这种催收评分卡来为我们的那些催收的兄弟们给他们服务一下,即“催收卡”或“回收卡”,主要应用在贷后管理阶段,特别是对于已经出现逾期情况的账户进行有效管理和催收策略制定。

对于C卡,Y变量可以根据实际情况灵活设定,比如依据是否经过内部催收成功回收欠款来定义。由于内外部催收成本和效果差异较大,C卡模型可能会着重分析哪些客户更适合内部催收,哪些需要移交外部催收机构,或者是如何根据逾期情况动态调整催收策略以提高回款效率。

你们知道我们很多金融模型用到的数据都是花钱买来的吗?尤其是A卡。因为用户新的一个平台,他是没有金融的历史表现的,你做的是一个金融模型啊,肯定金融数据是来的最直接的。连数据都没有,仅仅甩出来十个算法就做融合的话,效果也不会有多好的,所以很多公司都会去买别的公司的数据,或者去买这种人行的征信报告,或者一些其他的征信公司报告,里面往往会有这个人的一些信用数据,或者去购买一些这种数据公司的这种多头数据;

多头数据是个什么概念呢?就说一个人同时在多家平台贷过款。一般贷款平台越多,这个客户的资质肯定是越不好的,然后多头数据的话就会标出来都在多少的公司里面有贷过款;其实细想一下,这是一个非常滑稽的事情啊,我们其实是希望客户来贷款的。但他贷款贷的多了,我们又会觉得他是个坏人!

3.5、催收

催收是风控的最终手段。这个环节可以产生很多对模型有帮助的数据。比如催收记录的文字描述(例如你这个人,我打电话过去的时候,接了没?你过了多长时间接的?你接了之后跟我说了什么?你的情绪是什么样子的?然后以及你多次接电话的一个对比)、触达率(触达率就是说你接了还是没接?一般打电话不接的,这种的都不太可能会还钱的)、欺诈标签(完全触达不到的那些人就可以把他当做欺诈)等等。

逾期超过一定时间坏账的客户会被列入黑名单。其实只要是能被催回来的,都不是坏账。但是很多公司为了保险起见,逾期超过一定时间的客户,即使被催回来,也会被拉入黑名单。这里主要的算法就是催收模型相关的,可能是监督、无监督算法。也有基于社交网络算法构造的失联模型等等。

一般公司都有这种内催和外催,内催就是说公司会有自己的一些催收的人员,会用一种比较温柔的催收方式。去告诉他逾期是有什么样的坏处;外催的话,就会有各种各样的手段,当然现在也是严打暴力催收的,应该也不会说上门打人;

继续回到上面的论述,当我们购买了这些数据之后呢?我们会把它放到规则里面,比如说你贷款超过50家平台了,那我肯定就把你直接拒绝掉了。这个人有这么大的贷款需求,我很怀疑你是否有偿还的能力;也有可能他的某个征信分数直接高于800分,那可能在某些贷款公司的规则里面,他就直接通过了,连模型都不走的。

图片

04

总结

当接触到一个客户,肯定会先去采集它的数据,例如用户可能会在你的APP或者你们的官网填了它的四要素;然后你会去你们自己的数据库里面调这个人的数据,也可能会去其他的外部征信公司去调他们的数据,也有可能会通过你们的埋点数据去收集。数据拿到手里面,然后跟这一个人做这种唯一的匹配;

通过第一步会拒绝掉一部分人,就像个筛子一样过滤后进入到反欺诈引擎里面;反欺诈引擎一般都有什么?一般都会有反欺诈规则和反欺诈模型。如果这一块它也没有被拒绝掉,它就会流到我们的准入规则里面。规则就是我们平时常说的这个策略,这个阶段做的这个事情其实就是数据分析,数据挖掘。主要是用一些监督监监督的方法去。得到一些对业务很重要的字段。最后就是流到后面的风控模型里面;

更多干货知识,请关注公Z号#咻哥产品

  • 4
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

咻哥产品

你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值