为应对这些问题,电子商务与电子支付国家工程实验室、众安科技等一系列金融行业巨头持续开展金融反欺诈的各项行动,并联手信息行业巨擘英特尔,将前沿的人工智能技术引入反欺诈领域,构建了一系列高效可靠的反欺诈模型。
创新的三明治结构欺诈侦测模型
目前,金融行业对交易欺诈风险的侦测方式主要有两种:基于规则和基于机器学习算法。基于规则的方法是通过不断建立、更新基于交易行为特征的规则库,并在交易发生时,通过查询规则库判别交易潜在的风险。例如某便利店出现大额支付行为时,规则库就会去匹配这一交易行为是否具有异常特征。基于规则的反欺诈方法是基于对以往交易欺诈经验的总结与归纳,其主要依赖专家经验,存在一定的主观因素,且难免出现一些疏漏,在交易欺诈方式层出不穷的今天,存在一定的不足。
与基于规则的方法相比,基于机器学习方法的反欺诈方案具有更好的客观性及准确性。机器学习中一些优秀的分类算法,例如 LR(Logistic Regression,逻辑回归), RF(Random Forest,随机森林)以及 GBDT(Gradient Boosting Decision Tree,梯度提升决策树)等分类算法能够较好地学习到一些潜在欺诈模式,并已经被电子商务与电子支付国家工程实验室、众安科技等应用于反欺诈模型中。但在实际交易场景中,特征工程可能较为复杂,例如深夜在便利店,一张很久不用的信用卡突然出现大额支付行为,或者一个病毒性感冒患者长期频繁就诊且开具巨额药品。这里出现了 “深夜”、“很久不用”、“便利店”、“病毒性感冒”、“巨额” 等多种复杂特征,对传统机器学习的方法提出了挑战。
针对这一挑战,电子商务与电子支付国家工程实验室与英特尔双方工程师前期基于英特尔®BigDL 库、Spark Pipe Li