Rumor Detection on Social Media with Bi-Directional Graph Convolutional Networks

你好像有大饼

已于 2023-10-28 16:23:11 修改

阅读量279

点赞数 7

分类专栏：论文阅读文章标签： python 人工智能 pytorch

于 2023-10-28 16:12:33 首次发布

本文链接：https://blog.csdn.net/qq_45102874/article/details/134092228

版权

论文阅读专栏收录该内容

2 篇文章 0 订阅

订阅专栏

论文解读：Rumor Detection on Social Media with Bi-Directional Graph Convolutional Networks

利用双向图卷积网络对社交媒体上的谣言进行检测

来源：The Thirty-Fourth AAAI Conference on Artificial Intelligence (AAAI-20)
1.清华大学2.腾讯AI lab 请添加图片描述
背景：社交媒体由于其传播新信息的性质，在公众场合发展迅速，这导致了谣言的传播。与此同时，在社交媒体上从如此庞大的信息中发现谣言正成为一个艰巨的挑战。
现状：一些深度学习方法通过谣言的传播方式来发现谣言，如递归神经网络（RvNN）等。然而，这些深度学习方法只考虑了深度传播的模式，而忽略了谣言检测中广泛分散的结构。
实际上，传播和分散是谣言的两个关键特征。
贡献：在本文中，我们提出了一种新的双向图模型，即双向图卷积网络（Bi-GCN），通过操作自上而下和自下而上的谣言传播来探索这两个特性。
它利用一个具有自顶向下的谣言传播有向图的GCN来学习谣言传播的模式；以及一个具有相反的谣言扩散有向图的GCN来捕获谣言分散的结构。
此外，来自来源帖子的信息都涉及到GCN的每层，以增强来自谣言根源的影响。
在几个基准上令人鼓舞的实证结果证实了所提出的方法相对于最先进的方法的优越性。

介绍

传统方法：主要采用用户特征、文本内容、传播模式等手工特征来训练有监督的分类器，如：决策树（卡斯蒂略、门多萨和波布莱特，2011年）、随机森林(Kwon等，2013年）、支持向量机（SVM）(Yang等，2012年）。一些研究采用了更有效的特征，如用户评论（Giudice 2010）、时间结构特征（Wu、Yang和Zhu 2015），以及帖子的情绪态度（Liu et al. 2015）。然而，这些方法主要依赖于特征工程，这是非常耗时和劳动密集型的。此外，这些手工制作的特征通常缺乏从谣言的传播和分散中提取的高级表示。
最近的研究：利用深度学习方法从传播路径/树或网络中挖掘高级表示来识别谣言。许多深度学习模型，如长短期记忆（LSTM）、门控循环单元（GRU）和递归神经网络（RvNN）（Ma等人，2016；Ma，Gao和Wong，2018），被应用于谣言检测，因为它们能够学习谣言在时间上的顺序特征。然而，这些方法在效率上有一个显著的局限性，因为时间结构特征只关注谣言的顺序传播，而忽视了谣言分散的影响。谣言分散的结构也反映了一些传播行为。因此，一些研究尝试通过引入基于卷积神经网络（CNN）的方法（Yu等人，2017；2019）来涉及谣言分散结构的信息。基于CNN的方法可以获取局部邻居之间的相关特征，但无法处理图或树中的全局结构关系（Bruna等人，2014）。因此，这些方法忽略了谣言分散（dispersion）的全局结构特征。实际上，CNN并不是为了从结构化数据中学习高级表示设计的，而图卷积网络（GCN）是为此设计的（说明GCN能够从结构化数据中学习全局结构特征）（Kipf和Welling，2017）。
将GCN应用于谣言检测：那么，我们是否可以简单地将GCN应用于谣言检测呢？毕竟GCN已经在各个领域取得了进展，比如社交网络（Hamilton、Ying和Leskovec，2017）、物理系统（Battaglia等，2016）和化学药物研发（Defferrard、Bresson和Vandergheynst，2016）。答案是否定的。如图1(a)所示，GCN或称为无向GCN（UD-GCN）只关联相关帖子之间的关系来聚合信息，但却失去了传播顺序的信息。尽管UD-GCN能够处理谣言分散的全局结构特征，但它并没有考虑谣言传播的方向，而这在谣言检测中被证明是一个重要线索（Wu、Yang和Zhu，2015）。具体而言，沿着关系链进行深度传播（Han等，2014）和在社交群体中广泛分散（Thomas，2007）是谣言的两个主要特征，需要一种同时满足这两个特征的方法。
请添加图片描述

为了解决谣言的传播和分散问题，本文提出了一种新的双向GCN（BiGCN），它同时适用于自上而下和自下而上的谣言传播。该方法通过自上向下图卷积网络（TD-GCN）和自底上图卷积网络（BU-GCN）两部分获得了传播和分散的特征。如图1(b)和1©所示，TD-GCN从谣言树中节点的父节点转发信息来形成谣言传播，而BU-GCN从谣言树中节点的子节点聚合信息来表示谣言分散。然后，将TD-GCN和BU-GCN嵌入后的传播和分散表示通过全连接合并在一起，得到最终结果。同时，我们将谣言树的根特征与每个GCN层的隐藏特征连接起来，以增强谣言的根源的影响。此外，我们在训练阶段使用DropEdge（Rong et al. 2019），以避免我们的模型的过拟合问题。本工作的主要贡献如下：

我们利用图形卷积网络来检测谣言。据我们所知，这是第一次使用GCN进行社交媒体谣言检测的研究。
我们提出了Bi-GCN模型，该模型不仅考虑了谣言从上到下沿关系链传播的因果特征，而且还通过自下而上的收集从社区内的谣言分散中获得了结构特征。
在每个图卷积层上，我们将源帖子的特征与的其他帖子连接起来，以全面利用来自根特征的信息，并在谣言检测中取得优异的性能。

相关工作

近年来，社交媒体上的自动谣言检测引起了广泛关注。以往的谣言检测工作主要集中在从文本内容、用户概况和传播结构中提取谣言特征，从标记数据中学习分类器（卡斯蒂略、门多萨和波布莱特2011；杨等2012；权等2013；刘等2015；赵、雷斯尼克、梅2015)。马氏等人（Maet al. 2015）通过使用时间序列来建模手工制作的社会背景特征的变化，对谣言进行了分类。Wu等人（Wu，Yang，和Zhu 2015）提出了一种基于图核的混合SVM分类器，通过将RBF核与基于随机游走的图核相结合。Ma等人（Ma，Gao，和Wong 2017）通过构建了一个传播树核，通过评估其传播树结构之间的相似性来检测谣言。这些方法不仅无效，而且严重依赖于手工制作的特征工程来提取信息性的特征集。
为了自动学习高级特征，最近提出了一些基于深度学习模型的谣言检测方法。Ma等人利用循环神经网络（RNN）捕获时间内容特征的隐藏表示（Ma等，2016）。Chen等人改进了这种方法，将注意机制与RNN相结合，以不同的注意力关注文本特征（Chen等，2018）。Yu等人提出了一种基于卷积神经网络（CNN）的方法，学习输入序列中散布的关键特征，并对重要特征之间的高级交互进行建模（Yu等，2017）。Liu和Wu（2018）结合了RNN和CNN，通过时间序列获取用户特征。最近，Ma等人采用对抗学习方法改进了谣言分类器的性能，其中鉴别器被用作分类器，生成器通过生成冲突噪声来改进鉴别器（Ma、Gao和Wong，2019）。此外，Ma等人构建了一种树形结构的递归神经网络（RvNN），以从传播结构和文本内容中捕获隐藏表示（Ma、Gao和Wong，2018）。然而，这些方法在学习传播结构特征方面效率太低，并且忽略了谣言传播的全局结构特征。
与以上提到的深度学习模型相比，GCN能够更好地从图或树中捕获全局结构特征。受卷积神经网络在计算机视觉领域的成功启发，GCN已经在各种带有图数据的任务中展示出了最先进的性能（Battaglia等，2016；Defferrard、Bresson和Vandergheynst，2016；Hamilton、Ying和Leskovec，2017）。Scarselli等人（2008）首次将GCN引入为针对无向图或有向图的特殊消息传递模型。随后，Bruna等人（2014）根据谱图论理论对无向图的图卷积方法进行了理论分析。之后，Defferrard等人（2016）开发了一种名为Chebyshev Spectral CNN（ChebNet）的方法，并使用Chebyshev多项式作为过滤器。在这项工作之后，Kipf等人（Kipf和Welling，2017）提出了ChebNet的一阶近似（1stChebNet），其中每个节点的信息都从该节点本身和其相邻节点聚合而来。我们的谣言检测模型受GCN启发。

准备工作

在这里插入图片描述
请添加图片描述

Bi-GCN谣言检测模型

在本节中，我们提出了一种有效的基于谣言传播和谣言分散的基于GCN的谣言检测方法，称为双向图卷积网络（Bi-GCN）。Bi-GCN的核心思想是从谣言传播和谣言分散中学习合适的高级表示。在我们的Bi-GCN模型中，采用双层1stChebNet作为基本的GCN组件。如图2所示，我们使用Bi-GCN分4个步骤详细阐述了谣言检测过程。
请添加图片描述

在这里插入图片描述