电影《孤注一掷》中,首度曝光了境外网络诈骗全产业链黑幕,而洗钱是最为关键的一环。
王大陆饰演的赌徒阿天将偷和抵押房产凑够的800万元一次性汇入欺诈团伙的博彩账户,由于涉及大额资金流动,警方已经开始监控。令人意外的是,诈骗集团竟然能够将这800万分散并通过转账、支付和网购等方式,从一级卡片流向多个二级卡片,以此类推直至最终汇入海外。更令人担忧的是,该诈骗集团在全国各地居然有N个手下,仅需10分钟便可以完成取款和洗钱,他们的操作方式非常难以追踪,因为涉及的账户数量众多且分布广泛,要追回资金几乎比登天还难。
反洗钱(Money-Laundering)是个世界范围内广泛存在的问题,洗钱的人总想千方百计地把自己的黑钱合法化,他们为了逃避侦查,想出非常复杂多样的洗钱方法,不仅对人员进行了组织管理,而且也在通过最新的信息技术来规避监管,尤其是在进行交易时,往往会制造出大量错综复杂的关系,使资金网路内节点众多交错,旨在对侦查进行干扰。
在金融机构合规管理中,做好反洗钱工作已越来越受到监管部门和银行的重视,据媒体报道,2022年共有295家机构受到反洗钱处罚,总处罚金额破5亿。那么有没有一项黑科技能够准确、高效、穿透性地识别出层层错综的洗钱交易,同时能够赋能监管并保障金融部门稳健经营的目标呢?
图¹被认为是通过数学和图论的方式来表达资金流的最天然的方式。【对“图”感兴趣的读者可详细阅读:图数据库知识点2|图思维方式】
尤其是在资金流动的过程中,经过了多层跳转(hops)——犯罪分子通常会有意地构造多步、多层资金流转的模型来进行洗钱,显然,他们就是使用了图的方式。【对什么是K-hop感兴趣的读者可详细阅读:文库|图数据库基础知识—贰】
而监管机构如果还停留在关系型数据库或浅层图计算的时代,那么这些任何通过更深层伪装的洗钱路径将无法被识别出来。
所谓浅层计算,在数据库技术层面,指的是只能进行面向元数据的操作(例如聚合、筛选),而关系型数据库的舒适区恰恰就是在这个非常浅的层面。而深度计算指的是需要对(分门别类的)元数据进行关联查询,例如典型的多表关联操作,这类操作远离了关系型数据库的舒适区——因为让关系型数据库进行这种复杂、关联查询,其效率会随着查询深度的增加而指数级降低。【关于图数据库技术与传统关系型数据库的更多内容,感兴趣的读者可详细阅读:图数据库知识点1|图数据库与关系型数据库的区别】
在工业界,特别是银行业中经常说到一句话:“比同业早发现、比同业早行动”。通常指在发现风险、预防风险以及发现商机、捕捉商机的时候应该具备的内化能力,在本质上指的就是可以算得更快、更深和更准,而图数据库(图计算)就是这种内因外化时的一种具体的技术产品形态——图技术正在被越来越广泛地应用来解决风控(反洗钱)中的一系列挑战。
其中,深度图搜索、实时性、白盒可解释、稳定性等能力对于反洗钱场景中尤其是在庞大的资金网络中识别可疑资金,实时甄别洗钱行为,发现复杂可疑人员间的交易脉络,快速评估风险程度等已在反洗钱领域得到深入应用。 【对图数据库技术感兴趣的读者可详细阅读:图数据库知识点3|图数据库解决了什么问题?】
常见的反洗钱场景如下:从多个关联账户出发(转出账户)寻找到另外多个关联账户(收款方)的路径。或者,从1个账户出发,经过多层辗转后回到起始账号或初始账户的关联账户 ——后面这种情形称之为洗钱环路。
特征:参与洗钱的账户通常都具有转账额度在账户的日均余额中的占比极高(~100%),转账金额的账户内驻留时间短、多个账户可能共用同一设备、电话、WiFi APID或具有其他相同属性等。
银行系统中通常有数以千万计或亿计的账户,我们可以假设大多数账户都是守法的,因此在进行反洗钱查询时,如何能快速地过滤这些合法账户,并且锁定潜在的高风险账户,决定了计算复杂度的指数级的降低。账户的近期行为指标是个首要关注的过滤条件,当然还有其它的指标,例如账户间的多维度的关联关系,是否有资金往来等等。任何已经发生的洗钱行为,一定有起点和终点(终点会吸入所有的从起点转出的金额的大部分),在图上找到它们并不难。正在发生的洗钱行为,如何能实时阻断是很多金融机构所着重关注的。
上图展示的是从一个账户出发,通过层层转账,最终把钱转回给了自己(路径上的转账数据很显然扣除了手续费,并包含一些伪装数据)。这种环路²转账的模式本身并不一定就意味着100%是非法行为,但是至少值得通过系统报警来让专业人员关注这种模式并加以甄别是否属于洗钱行为。
另外,对于金融机构而言,有组织犯罪的洗钱规模和频率通常会远高于个别的零售客户,因此AML关注的要点应该是洗钱规模大、发生频率高、牵连账户多,以及跨行、跨境内外的洗钱行为。在图上面,通过进行转账链路过滤分析,锁定资金汇集点(例如入度³远大于出度)、高频大额交易账户等操作可以高效地识别反洗钱参与账户,并为实时阻断或二次分析提供技术支撑。
以下图为例,它表达的是从一个账户出发经过~10层的分散转账后,资金逐步汇聚到了一个最终账户。如果监管机构的规定是查询3层,金融机构的识别深度只有5层,那么根本没有可能发现到这种深层次的洗钱模式。这种实时的深度的链路、网络转账识别如果没有原生图内存计算引擎的支撑,几乎无法实现。【感兴趣的读者可以详细阅读:高并发图数据库系统是如何实现的?】
传统意义上的图系统,例如基于Spark+GraphX,开源的JanusGraph、ArangoDB或商业版的Neo4J,在进行5层以上的深度查询时,都会显得极为缓慢甚至无法返回。而在单笔查询的时效性上或系统的并发吞吐率上,它们也存在着时延大、并发能力低下(QPS/TPS不高)的问题。【感兴趣的读者可以详细阅读:图数据库知识点7|为什么你遇到的图数据库不靠谱?】而对于金融系统而言,速度和性能一定是第一位的——因为时间就是金钱,在锁定犯罪链路的时耗上,每浪费一秒都是对犯罪团伙的姑息与纵容和对金融资产的危害。
通过面向图数据集的高并发、深度、低延迟查询等技术来赋能金融行业客户实现实时的深度反洗钱,并具有高可视化、易用度高、集成便捷等特点。我们深信下一代的反洗钱IT基础架构中必将有实时图数据库(图计算)、图存储、图中台的一席之地!【感兴趣的读者可以详细阅读:图数据库知识点6|如何正确评测图数据库?】
[1] 图:图是由顶点的有穷非空集合和顶点之间边的集合组成,通常表示为 G = (V, E),其中,G表示一个图,V是图G中顶点的集合,E是图G中顶点之间边的集合。
[2] 环路(in-degree) :当路径中的点重复出现时,称路径含有环路成分。
[3] 入度(in-degree) : 在有向图中,度又分为入度和出度。以某顶点为弧头,终止于该顶点的弧的数目称为该顶点的入度。出度(out-degree) :以某顶点为弧尾,起始于该顶点的弧的数目称为该顶点的出度。