PARTITIONING MESSAGE PASSING FOR GRAPH FRAUD DETECTION
Motivation
在Graph Fraud Detection (GFD) 任务中应用消息传递GNN遇到两大挑战:
- label imbalance
- homophily-heterophily mixture
在本文中,我们认为排除异配邻居的复杂可训练或预定策略是不必要的. 相反,在欺诈图上应用GNN的关键是在消息传递过程中区分邻居,而不是排除. 一个强大的模型应该固有地具有自适应调节从同配和异配邻居获得的信息的能力.
方法
PMP(Patitioning Message Passing)的基本思想是利用标签信息对消息传递过程进行划分,使模型能够在消息传递过程中通过学习每个类的不同权重来根据类来区分邻居,从而增强其自适应调整类不平衡邻居节点传播的影响的能力.
节点
v
i
v_i
vi的PMP的第
l
l
l次消息传递迭代描述如下:
be: benign neighbors
fr: fraud neighbors
un: unlabeled neighbors
将未标记的neighbors处理为恶意和良性标签的加权组合.
Root-specific权重矩阵生成.
Ψ由单层MLP实现
Theoretical Insights
在异配区域中,中心节点的标签与其大多数邻居不同,GNN必须自适应地改变其光谱响应以捕获这种对比标签信息。一些工作(Yang等人,2022 a; Wang & Zhang,2022)表明,为每个特征维度分配一个单独的光谱滤波器可以提高GNN的性能。因此,我们的模型在节点级别实现了自适应性,每个节点被分配一个单独的光谱滤波器。具体地说,我们提出了以下定理。
实验结果
三个常用的不平衡分类指标:AUC,F1-Macro和G-Mean
AUC是ROC曲线下面积,它提供了所有可能的分类阈值的综合性能指标,反映了模型区分positive和negative类的能力.
F1-Macro独立计算每个类别的F1分数,然后取平均值.
G-Mean (geometric mean), 计算灵敏度和特异性乘积的平方根,从而深入了解TP率和TN率性能之间的平衡.