随着量化宽松和经济复苏,商业银行消费金融进一步发展,在移动支付、大数据、人工智能等技术快速发展的背景下,消费金融领域开展了诸多创新,金融借贷业务发展迅速。
先介绍下金融借贷业务流程:用户前来申请借贷,经过欺诈识别后,把欺诈团伙和主观欺诈的个人拒绝掉,然后对通过的人进行信用评估,最后根据额度模型,算出利润最大化时放款金额。
举个真实的团队欺诈的例子。宜人贷在他们的财报中公布的,他们被一个团伙成功撸走了2000多单,当时宜人贷的件均4w, 一下损失了8000w!
那么如何防范这种风险呢。这就是今天要分享的图算法。图可以将这些一个个有良好记录的个体关联起来,一网打尽。
Graph简介
G=(V,E)G=(V,E)V:vertex set
E:edge set (有向,无向,有权重和没有权重)举例,两个人之间的联系, A给B买了东西,A和B之间的通话次数时长多于A和C之间。度中心性(Degree Centrality) - 表示连接到某节点的边数。在有向图中,我们可以有2个度中心性度量:流入和流出。一个节点的节点度越大就意味着该节点在网络中就越重要。
接近中心性(Closeness Centrality) - 从某节点到所有其他节点的最短路径的平均长度。反映在网络中某一节点与其他节点之间的接近程度。
介中心性(Betweenness Centrality) - 某节点在多少对节点的最短路径上。介数中心性是比较能体现节点在图中桥梁作用的中心性度量方法。介数反映了相应的节点或者边在整个网络中的作用和影响力,具有很强的现实意义。例如,在交通网络中,介数较高的道路拥挤的概率很大;在电力网络中,介数较高的输电线路和节点容易发生危险。
社团发现算法一般有:最小割, 正则化割:通过计算图的最小割,即将网络划分为预定的分组数,并使连接各分组的边的条数最少。
非负矩阵分解:基本原理是将原始矩阵分解得到社区指示矩阵和基矩阵
基于模块度的社区划分
基于节点相似性的社区划分最小割算法广泛应用在分布式计算的负载均衡中,对集群节点的分组有利于减少不相关节点之间的通信。然而由于该算法限定了网络最终分组的个数,而不能通过算法“发现”节点间的内在联系并自然地构成若干个社区,因此最小割算法应用较为局限。
本文主要分享这两类的主要算法,基于模块度的 louvain和基于信息熵infomap,基于相似度的node2vec
模块度(Modularity)公式及简化
优化目标:一般认为社团内部的点之间的连接相对稠密,而不同社团的点之间的连接相对稀疏。
所以模块度也可以理解是社区内部边的权重减去所有与社区节点相连的边的权重和,对无向图更好理解,即社区内部边的度数(内部的连线数)减去社区内节点的总度数。
模块度公式的解释
节点i和节点j之间边的权重&#