基于知识图谱的小微企业贷款申请反欺诈方案
金磐石1, 万光明2, 沈丽忠3
1 中国建设银行股份有限公司,北京 100033
2 中国建设银行金融科技部,北京 100032;
3 建信金融科技有限责任公司厦门事业群,福建 厦门 361008
关键词:反欺诈 ; 企业画像 ; 关联图谱
论文引用格式:
金磐石, 万光明, 沈丽忠. 基于知识图谱的小微企业贷款申请反欺诈方案. 大数据[J], 2019, 5(4):100-112
JIN P S, WAN G M, SHEN L Z.Knowledge graph-based fraud detection for small and micro enterprise loans. Big Data Research[J], 2019, 5(4):100-112
1 引言
随着我国经济发展步入新常态,小微企业快速发展,并逐渐成为我国市场经济中较活跃的主体。据相关数据统计,目前我国约有近1亿户小微企业,这些小微企业广泛分布于实体经济的各行各业。作为经济发展和社会稳定的重要支柱,小微企业在促进人才有序流动、维护市场活力、推动科技创新等方面发挥着不可或缺的作用。然而相对于大中型企业而言,小微企业在市场竞争中仍处于弱势地位,融资问题导致其很难保证经营的稳定性与持续性。
银行贷款是企业融资的重要手段,为缓解小微企业的经营压力并满足强烈的融资需求,商业银行的小微贷款业务逐步扩张,各类信贷产品应运而生。截至2018年第三季度,小微企业在银行机构的贷款总额达33.04万亿元,贷款授信户数超过1 800万户。但由于小微企业在提供自身资讯上的天然弱势,“不透明”“内部化”的非对称数据信息使得银行难以在业务申请阶段把控小微客户实质性的信贷风险,对小微企业信贷产品的管理比大型企业也困难得多。如今,欺诈风险已经成为消费金融业务面临的主要风险之一,反欺诈也对银行的风险控制技术提出了更高的要求。科学合理地进行小微企业贷款欺诈风险管理已经成为商业银行亟须解决的问题。
小微企业贷款业务是近年来兴起的一种贷款手段,由于其“新”的特征,在金融行业内对小微信贷欺诈尚没有一个通用的定义。商业银行在信贷申请欺诈风险的防范工作方面已经积累了很多经验,但是当前的工作多为面向大中型企业或面向个人信贷的反欺诈方案。不论是较为原始的黑白名单甄别、实现自动决策的规则引擎,还是基于人工智能技术的风险量化与无监督的欺诈模式识别,反欺诈的分析和度量技术在小微企业领域仍在探索的过程中。
为解决以上难题,本文针对小微企业的信贷业务特点提出了一种基于全方位企业画像与企业关联图谱的贷前反欺诈模型。该模型从企业自身、企业实控人、企业干系人以及企业网络关系图谱四大维度提取特征,然后在金融行业知识的辅助下,通过数据挖掘、特征筛选等方法定义多个欺诈场景,并利用LightGBM分类器对欺诈进行概率推断。相比传统的信贷欺诈分析模型,本文方案将关系型信息和企业节点自有属性信息有机地结合,能够有效地挖掘小微企业与欺诈目标的非线性关系,有助于全面、有效地在申请阶段评估小微企业的欺诈风险状况。相比于传统的企业风控反欺诈,本文方案的创新点如下。
● 针对小微企业信息不对称的特点,整合多源数据集,在提取企业自身特征的同时,利用其关联实控人及相关干系人的基本信息与征信状况生成全方位企业画像,更加完善地刻画小微企业可能存在的信贷风险。
● 结合图知识和金融行业知识,挖掘欺诈场景,通过分析小微企业命中欺诈场景的情况,输出欺诈概率。
● 挖掘并构建企业与企业间的关联信息,建立企业关联图谱,有利于识别出异常的欺诈行为。
● 归约掉图谱中的非企业节点,将复杂、庞大的异构关系网络折叠为仅保留小微企业实体的同构网络。这既解决了网络存储的开销问题和网络特征提取的计算复杂度高的问题,又能够隔离无关节点的干扰,直观地呈现企业之间的联系。
● 使用 LightGBM 分类框架,采用有监督学习模式在构建的关联图谱上进行基于节点自身属性特征与网络特征的欺诈概率预测,从关系和实体属性两个角度共同进行欺诈评估。
2 相关工作
2.1 企业传统信贷反欺诈
有监督学习是当下反欺诈检测中应用广泛的机器学习方法,能够