基于机器学习和深度学习的图数据异常检测综述

背景

「图」 (Graph) 普遍用于建模结构/关系性数据,「节点」 (vertices/nodes) 表示实体,「边」 (edges) 表示实体间存在的关系。

「异常检测」(Anomaly detection)指从数据中挖掘出与大部分对象不同的目标对象(异常点/离群点),这些目标对象的分布和产生机制与其它对象不同。

「图异常检测」(Graph anomaly detection)问题是指:

  • 「Object-level」:在单个图中识别出异常的图对象,例如异常节点、异常边或者异常子图(node/edge/sug-graph-level anomalies);

  • 「Graph-level」:在图集合/图序列中识别出异常图;

传统异常检测方法和图异常检测方法的区别如下图所示,传统方法不能高效地用于大规模图学习任务并且难以捕获对象节点间的关系,因此基于深度学习的图异常检测方法逐渐兴起,尤其是图神经网络 GNN 的热潮。

72fcf017d6e041e6721cf54157285d9a.png

但基于深度学习的图异常检测方法存在非常多的局限性:

  • 如何设计异常感知的模型目标函数,可以在模型训练过程中区分异常对象?

  • 如何解释模型检测到的异常,尤其在于金融等传统行业?

  • 如何提高模型的的训练效率并且节约计算资源?

  • 如何在缺少监督信息的情况下优化深度模型的超参数?

面向图数据的异常检测可以应用于社会生活的各个领域,如金融、互联网安全、社交关系挖掘、电信诈骗检测等等。

本文主要学习和总结下当前基于深度学习的图异常检测算法,主要依赖的论文大纲 [^1] 并对其进行简化和补充。

算法模型

根据算法模型的检测级别图异常检测任务大体上分为三类:

在上述分类下可以根据图数据类型可以进一步区分,主要包括:① 静态图:简单图,属性图 ② 动态图。📢 同一模型可以解决不同级别的问题。

由于篇幅较长,因此在这个系列中会分三部分进行介绍,最后给出总结。可以根据以上分类下的介绍进行查看!!

数据集

目前已有大量的图数据集开源,可在论文提供的数据源下载:

  • 个人收集:图神经网络 GNN 基准数据集汇总[^2]

  • 论文总结7338c73f6f87ab06fefac6831f162ffc.png

学习资源

  • awesome-fraud-detection-papers

开源算法模型

目前开源但不局限于以下内容:

ModelLanguagePlatformGraphCode
SedanspotC++-Dynamic Graphhttps://www.github.com/dhivyaeswaran/sedanspot
AnomalyDAEPythonTensorflowDynamic Attribute Graphhttps://github.com/haoyfan/AnomalyDAE
MADANPython-Static Attributed Graphhttps://github.com/leoguti85/MADAN
PAICANPythonTensorflowStatic Attributed Graphhttp://www.kdd.in.tum.de/PAICAN/
ChangedarMatlab-Dynamic Attributed Graphhttps://bhooi.github.io/changedar/
ONEPython-Static Plain Graphhttps://github.com/sambaranban/ONE
DONE&AdONEPythonTensorflowStatic Attributed Graphhttps://bit.ly/35A2xHs
SLICENDICEPython-Static Attributed Graphhttp://github.com/hamedn/SliceNDice/
SemiGNNPythonTensorflowStatic Attributed Graphhttps://github.com/safe-graph/DGFraud
CARE-GNNPythonPytorchStatic Attributed Graphhttps://github.com/YingtongDou/CARE-GNN
GraphConsisPythonTensorflowStatic Attributed Graphhttps://github.com/safe-graph/DGFraud
GLODPythonPytorchStatic Attributed Graphhttps://github.com/LingxiaoShawn/GLOD-Issues
GCANPythonKerasHeterogeneous Graphhttps://github.com/l852888/GCAN
HGATRDPythonPytorchHeterogeneous Graphhttps://github.com/201518018629031/HGATRD
GLANPythonPytorchHeterogeneous Graphhttps://github.com/chunyuanY/RumorDetection
ANOMRANKC++-Dynamic Graphhttps://github.com/minjiyoon/anomrank
DAGMMPythonPytorchDynamic Graphhttps://github.com/danieltan07/dagmm
OCANPythonTensorflowStatic Graphhttps://github.com/PanpanZheng/OCAN
DevNetPythonTensorflowStatic Graphhttps://github.com/GuansongPang/deviation-network
RDAPythonTensorflowStatic Graphhttps://github.com/zc8340311/RobustAutoencoder
GADPythonTensorflowStatic Graphhttps://github.com/raghavchalapathy/gad
GEMPython-Static Graphhttps://github.com/safe-graph/DGFraud/tree/master/algorithms/GEM
MIDASC++-Dynamic Graphhttps://github.com/Stream-AD/MIDAS
DeFrauderPython-Static Graphhttps://github.com/LCS2-IIITD/DeFrauder
DeepFDPythonPytorchBipartite Graphhttps://github.com/JiaWu-Repository/DeepFD-pyTorch
STS-NNPythonPytorchStatic Graphhttps://github.com/JiaWu-Repository/STS-NN
UPFDPythonPytorchGraph Databasehttps://github.com/safe-graph/GNN-FakeNews
DeepSpherePythonTensorflowDynamic Graphhttps://github.com/picsolab/DeepSphere
OCGINPythonPytorchGraph Databasehttps://github.com/LingxiaoShawn/GLOD-Issues
DeepSADPythonPytorchNon Graphhttps://github.com/lukasruff/Deep-SAD-PyTorch
DATEPythonPytorchNon Graphhttps://github.com/Roytsai27/Dual-Attentive-Tree-aware-Embedding

[^1]: A Comprehensive Survey on Graph Anomaly Detection with Deep Learning.

[^2]: https://dreamhomes.top/posts/202108101505/

推荐阅读:

我的2022届互联网校招分享

我的2021总结

浅谈算法岗和开发岗的区别

互联网校招研发薪资汇总

2022届互联网求职现状,金9银10快变成铜9铁10!!

公众号:AI蜗牛车

保持谦逊、保持自律、保持进步

1f993347191ec580a66e03dea897495a.png

发送【蜗牛】获取一份《手把手AI项目》(AI蜗牛车著)

发送【1222】获取一份不错的leetcode刷题笔记

发送【AI四大名著】获取四本经典AI电子书

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值