A Semi-supervised Graph Attentive Network for Financial Fraud Detection 个人总结

A Semi-supervised Graph Attentive Network for Financial Fraud Detection 个人总结

写在前面:为方便阅读,尽量使用中文总结,对于翻译无把握或专有词汇,在中文后附上原文字段。此外,水平有限,对文章理解有偏差部分恳请大家海涵, 指正。
顺便,移步去GitHub看看憋>﹏<

0. 原作信息

@inproceedings{wang2019semi,
  title={A Semi-supervised Graph Attentive Network for Financial Fraud Detection},
  author={Wang, Daixin and Lin, Jianbin and Cui, Peng and Jia, Quanhui and Wang, Zhen and Fang, Yanming and Yu, Quan and Zhou, Jun and Yang, Shuang and Qi, Yuan},
  booktitle={2019 IEEE International Conference on Data Mining (ICDM)},
  pages={598--607},
  year={2019},
  organization={IEEE}
}

1. Contribution 本文贡献

  • 设计semi-supervised GNN,利用有标签、无标签数据。(通过设计不同 L o s s Loss Loss实现)

  • 使用Hieranchical Attention,增加模型可解释性

  • 在花呗的异构数据上很work。

2. Background 背景信息

  • 任务: 欺诈检测,Fraud Detection

    可视作分类任务,由于异常点的采集,标注极其耗费人力物力,数据集常为少量有标签数据(labeled data),及大量无标签数据(unlabeled data).

    模型需要具备解释性, 能向部署方, 被检测者说明检测的判别标准.

  • 过往检测方式

    • 基于规则, Rule-based
      • 原理: 假定欺诈活动基于一定可观测的模式
      • 缺点: 耗费人力手工设定, 依赖专家知识; 容易被攻击
    • 基于统计特征的机器学习模型
      • 如SVM, 树模型等
      • 缺点: 未利用用户间交互信息
    • 图表示学习的尝试
      • 黑箱模型,缺乏解释性
  • 综上,欺诈检测建模有如下灵魂三问:

    1. 如何处理不平衡的数据,利用无标签的数据? (semi-supervised)
    2. 如何利用用户间交互,及不同类别的特征? (heterogenous graph)
    3. 如何保证模型可解释性?

3. The Model Semi-GNN 模型

3.1 Problem Definition and Notations 问题定义及注记

  • 图的构建

    graph

    • 重点研究User用户类型节点, 图中有标签数据<<无标签数据
    • 异构图(文中记为multiview graph), G v = { U ∪ S v , E v } , v ∈ { 1 , … , m } G^{v}=\left\{U \cup S^{v}, E^{v}\right\}, v \in\{1, \ldots, m\} Gv={ USv,Ev},v{ 1,,m}, v v v即view
    • view由具体业务确定, 本文中部分view是从用户特征处理产生的, 以增加结构信息. (详见实验部分数据集处理)
  • 注记:

notation

3.2 Overview 整体架构

model

node level(聚合各view内信息) → view level(整合views信息,得到对user的embedding) → relation loss ( 对有/无标签数据不同损失)

3.3 Node Level

node

对于节点u, i在view v中的特征表示, 设为 e u i v e_{u i}^{v} euiv

∵ 不同邻居节点对节点u的影响不同, 引入Attention来自主学习邻居节点的权重,

α u i v = exp ⁡ ( e u i v ⋅ H u i v ) ∑ k ∈ N u v exp ⁡ ( e u k v ⋅ H u k v ) \alpha_{u i}^{v}=\frac{\exp \left(e_{u i}^{v} \cdot H_{u i}^{v}\right)}{\sum_{k \in \mathcal{N}_{u}^{v}} \exp \left(e_{u k}^{v} \cdot H_{u k}^{v}\right)} αuiv=kNuvexp(eukvHukv)exp(euivHui

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值