【风控策略开发】反欺诈之基于社交网络识别欺诈团伙

反欺诈要实现的目标

反欺诈要实现的目标很简单,就是最大可能地识别和拦截欺诈,反映到具体的风控指标上,主要有以下三个。

1)降低首逾比例。通过与过去一段时间比较首逾比例(首逾比例主要是指如fpd30、fpd90等逾期金额或逾期笔数占比)下降幅度,可从侧面反映反欺诈工作成效。

2)提高挽损金额。挽损金额是指在客户交易时被反欺诈拦截且后来证明该客户为欺诈客户所对应的拦截金额。挽损金额的绝对值体现了反欺诈团队的存在价值,挽损金额越高,反欺诈团队存在的意义越大。

3)提高欺诈确认率。在反欺诈团队对疑似欺诈客户或疑似团伙进行反欺诈调查时,欺诈确认率越高,说明反欺诈工作做得越好,反之则说明反欺诈工作做得不够好。

反欺诈手段

在了解欺诈后,就需要针对欺诈从包括产品设计、营销获客、授信审批、用信审批、贷中检测、案件调查、催收管理、信息安全、黑名单管理等在内的全流程尽可能识别和防控欺诈。常见的在上述流程中经常使用的被证实比较有效的反欺诈手段有以下四种。

1)在授信审批和用信审批等流程中,采用身份证OCR识别、活体识别、二要素验证、三要素验证、四要素验证、密码校验等手段防止身份冒用、账户盗用、虚假申请。

2)构建针对欺诈客户、欺诈设备、欺诈电话、欺诈IP地址、欺诈GPS等的欺诈黑名单库,在授信申请、用信申请等流程中拦截欺诈客户的申请。

3)构建识别欺诈个体和欺诈团伙的反欺诈模型,精准识别欺诈客群。

4)开发识别欺诈个体和欺诈团伙的反欺诈规则,精准拦截欺诈客群。

反欺诈模型

在反欺诈过程中,反欺诈模型是精准识别欺诈的利器,在反欺诈模型开发完成后,主要由反欺诈策略利用反欺诈模型结果精准拦截欺诈。

虽然欺诈的分类方法有多种,但是反欺诈模型主要有两种,分别是识别个体欺诈的反欺诈模型和识别团伙欺诈的反欺诈模型。在开发识别个体欺诈的反欺诈模型时,常使用以逻辑斯谛回归、XGBoost、LightGBM等为代表的有监督学习算法,在欺诈样本不足时,常将首逾超过一定天数的样本作为坏样本来建模;在开发识别团伙欺诈的反欺诈模型时,若开发的是图模型,则常用以Louvain算法为代表的无监督学习算法来建模,若开发的是分类模型(如GPS评分卡模型),则使用的算法以逻辑斯谛回归、XGBoost、LightGBM等有监督学习算法为主。

在贷前和贷中部分已经讲过其中主要涉及的反欺诈模型,在实际生产中,选择相应的反欺诈模型进行开发和使用即可。需要强调的是,在反欺诈过程中,识别和拦截欺诈团伙往往是反欺诈工作的重中之重,因为欺诈团伙性质非常恶劣,且一旦欺诈成功,往往会给金融机构带来难以估量的损失,所以开发有效的识别团伙欺诈的反欺诈模型显得尤为重要。

反欺诈策略

在风控过程中,主要通过反欺诈策略识别和拦截欺诈。反欺诈策略主要是基于反欺诈模型结果、相关风控数据源设计和挖掘反欺诈规则进行欺诈识别和欺诈拦截。在贷前和贷中部分已经讲过,反欺诈策略主要包括反欺诈核身、反欺诈准入等HC类策略和反欺诈判断等非HC类策略两部分。

反欺诈HC类策略比较简单,就是基于比较确定的硬性欺诈指标(如欺诈黑名单)拒绝客户的申请、交易等行为;反欺诈非HC类策略主要是基于如欺诈模型分和相关风控数据源进行分析,找出对欺诈区分度较高的规则,灵活进行欺诈识别和拦截。常见的反欺诈非HC类策略可以从客户关联关系(如同一客户关联较多的设备“指纹”、同一客户关联较多的申请电话、同一设备“指纹”关联较多的客户、同一联系电话关联较多客户等)、地域集中度(如同一GPS短时大量申请)、地理位置短时变化大(如短时间GPS定位距离相距较远)、特殊时间段大额交易(如凌晨2~5点的交易金额大于5万元)、欺诈模型分等维度进行分析和挖掘。

反欺诈策略的全生命周期管理与其他策略是类似的,不同之处在于进行策略分析时选用的样本和目标字段不同,本节不再赘述。

基于社交网络识别欺诈团伙

在金融场景中,团伙欺诈识别是反欺诈工作的重中之重,本节主要介绍如何基于Louvain算法构建团伙欺诈识别模型来识别欺诈团伙。

社交网络简介

社交网络是一种由许多节点和边构成的社会结构,节点通常是指个人或组织,而边代表各种社会关系。通常用图来表示社交网络,即G={V,E},V是用户节点(Node)的集合,E是边(Edge)的集合。图是一个简单的社交网络图,其中圆表示节点,节点之间的连线表示边。

在构建了社交网络后,会经常使用以下6个指标对网络中的重要节点和网络紧密程度进行分析。

1)度(Degree):一个节点连接的边数。

2)距离:在社交网络里,两节点之间的最短路径上所包含的边的数目就是两个节点之间的距离。在失联修复模型中,可通过联系距离失联节点比较近的节点来间接触达失联客户,督促失联客户尽快还贷。

3)路径:两节点之间的路径由其所需要经过的边组成。

4)度中心性(Degree Centrality):一个节点的度越大,说明这个节点越具备度中心性,在社交网络中的影响力越大。

5)接近中心性(Closeness Centrality):若一个节点与社交网络中其他节点的距离均较近,则认为该节点接近中心性较高。接近中心性反映了社交网络中某一节点与其他节点间的接近程度,具有高接近中心性的节点在社交网络中被高度连接。

6)中介中心性(Between Centrality):在社交网络内所有的两节点间的最短路径中,经过某个节点的条数越多,那么该节点就越重要。中介中心性代表了节点在社交网络传播时发挥的影响力。

在上面提到的6个指标中,中心性相关的3个指标主要从不同的角度计算了社交网络中比较重要的节点。

  • 7
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值