基于元路径的利用多级社会背景信息的虚假新闻检测

原文

《Meta-Path-based Fake News Detection Leveraging Multi-level
Social Context Information》

一 论文目标

本文提出使用元路径中的实例来无损失地提取有效信息,用于虚假新闻检测。

二 具体方法

在这里插入图片描述
在这里插入图片描述

1 构图和特征工程

如图2,数据处理过程其实就是分别对user节点和publisher节点做node2vec和doc2vec,然后将特征拼接起来。

2 元路径实例提取

在这里插入图片描述

  • 可以看出上述特征是之前预处理过的
    在这里插入图片描述
    定义了两种元路径,根据target new从而把每张图分成两个子图,用户有按照时间先后进行排序(按照参与的时间先后进行排序,如右上图的p4,p3矩阵)

3 详细模型构造

在这里插入图片描述

3.1 节点特征转换

在这里插入图片描述
不同节点的维度不同,转换到相同维度

3.2 元路径实例编码

在这里插入图片描述

  • 这里的思路是借鉴知识图谱中的嵌入,把知识图谱中的主谓宾拓展到该论文中提出的元路径(三个实例两个边关系)

在这里插入图片描述
在这里插入图片描述

  • 上述每个p实例通过元路径嵌入可以得到对应的嵌入向量

3.3 元路径实例聚合

注意力部分:
在这里插入图片描述
在这里插入图片描述

对于用户部分,类似用户传播序列,采用gru:
在这里插入图片描述

3.4 语意聚合

在这里插入图片描述
最后两个输出的向量再加一个注意力权重,
在这里插入图片描述
最后是目标函数:
在这里插入图片描述

三 实验

在这里插入图片描述

在这里插入图片描述

  • 左边的fake是虚假信息,右边的fake是误传信息。误传信息没有周期行为,没有出现周期性尖峰,跟真实信息一样很快趋于0。而虚假信息会被反复提及,会有周期性行为,与真实信息差异较大。

在这里插入图片描述

  • FANG数据集中的fake是虚假信息,因此会有更多时序信息;用gru效果更好;而HealthStory中的fake是误传信息,用attention来捕捉其他信息会有更好效果。

在这里插入图片描述

在这里插入图片描述

  • 只用30%的数据量就可以实现比其他方法用完整的数据集精度更高了

四 思考

用了元路径,嵌入过程把边关系也做了一个嵌入,因此学习到的向量可能更具有潜在信息

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值