谣言检测论文阅读：HENIN Learning Heterogeneous Neural Interaction Networks

Asonare

已于 2023-02-03 01:42:15 修改

阅读量306

点赞数

文章标签：网络人工智能深度学习

于 2023-02-03 01:15:29 首次发布

本文链接：https://blog.csdn.net/Asonare/article/details/128859929

版权

一、研究背景

近年来，网络欺凌已成为青少年中最紧迫的网络风险之一，引起了社会的严重关注。网络欺凌通常被定义为通过电子方式传播侮辱性或令人尴尬的评论、照片或视频。受害者可能会经历较低的自尊，自杀意念的增加，以及各种负面情绪反应。现有的自动检测网络欺凌的努力主要集中在用户评论的文本分析，包括关键词这些研究试图以高维文本特征作为输入，构建通用的二值分类器并进行相应的预测。尽管这些模型在实践中具有良好的检测性能，但在很大程度上忽略了网络欺凌行为的时间信息。他们也忽略了社交网络中的用户互动。此外，这些方法大多集中于有效地检测网络欺凌会话，但不能解释“为什么”一个媒体会话被检测为网络欺凌。给定一个具有用户属性的评论序列，我们认为顺序学习可以让我们更好地利用和建模单个评论之间的演化和相关性。此外，基于图的学习可以让我们表示和学习用户在一个会话中如何相互交互。。为此，我们通过一个连贯的过程构建了一个可解释的网络欺凌检测框架——异质神经交互网络(HENIN)。用HENIN解决了几个挑战:

a）如何执行可解释的网络欺凌检测，以提高检测性能。

b）如何在没有基本事实的情况下突出可解释的评论。

c）如何对发布的文本和用户评论之间的相关性进行建模

d）如何根据用户来模拟会话之间的交互，以及根据单词来模拟文本帖子之间的交互。

二、相关工作

相关研究可以分为基于社会背景的方法和基于用户评论的方法。

基于社会背景的方法利用了三类特征:基于user的特征、基于post的特征、基于network的特征

a）基于 post 的功能依赖于文本分析来识别社交媒体上的网络欺凌证据

b）从user档案中提取基于用户的特征，以衡量其特征。性别特征、用户过去的帖子、账号注册时间和常用词汇是有用的基于用户的特征

c）基于network的特征通过构建描述帖子如何传播以及用户如何相互交互的传播网络或交互网络来学习的。

基于用户评论的方法利用用户评论序列来检测源帖的网络欺凌。CONcISE 是一种对评论序列进行序列假设检验以选择显著评论特征的方法。Raisi 和Huang通过从用户评论中识别专家提供的关键短语来检测基于骚扰的网络欺凌。

三、HENIN模型

本文提出的HENIN模型，包括四个组件:一个联合的词级和句子级评论编码器、一个评论后的共同注意机制、会话-会话和post-post 交互抽取器，以及最终的网络欺凌预测。

注释编码器组件通过分级的词级和句子级自注意网络，将注释语言特征描述为潜在表示特征很有效。评论的可解释程度是通过句子级自我注意学习中的注意权重来学习的。在词嵌入层面实现了评论后共同注意机制。通过评论后的共同关注，可以了解所发布的文本与评论之间的相互作用。另一方面，会话-会话交互提取器和 post-post 交互提取器旨在通过两个图形卷积神经网络建模用户如何跨媒体会话交互，以及单词如何在帖子之间相互关联。最后，将上述三个要素的表示形式串联起来进行网络欺凌预测。

评论编码。一组与给定媒体会议有关的评论包含了单词和句子层面的语言线索。注释中的文本用法为解释为什么会话被检测为网络欺凌提供了不同程度的重要性。例如：“fuck”和“shit”提供了更多的信号来反映明显和明显的情绪。同时，强烈表达了对人的恶意评论，因此，他不仅更容易解释，还更容易判断他是否为网络霸凌会话。

文字编码器。给定一个带有 m个单词的注释 cj，我们首先通过预先训练的word2vec 模型将单词嵌入到一个潜在空间。然后通过计算相应的点积来获取评论之间的上下文关系

句子编码器。类似于单词编码器，我们利用缩放的点积注意力来编码每个媒体会话。其目的是捕获句子层面的上下文信息，并从学习到的评论嵌入向量{c1, c2，…，ck}。每个帖子的句子嵌入将被用作网络欺凌预测的特征。

评论后共同关注机制。为了模拟评论与发表文本之间的交互作用，我们提出了一种学习评论与发表文本语义词级相关性的评论后协同注意机制。也就是说，我们打算同时学习和推导单词对已发布的文本和评论的注意力权重。具体来说，首先，类似于评论编码，通过预先训练的 word2vec 模型获得已发布文本的单词嵌入。我们采用带有双向门控循环单元(GRU)的循环神经网络从两个方向对单词序列进行建模。

四、实验

实验目标：

问题一：HENIN 能否提高网络霸凌媒体会话分类性能?

问题二：HENIN 的每一种成分的效果如何?

问题三：HENIN能够对网络欺凌进行准确的早期检测吗?

问题四：HENIN能否解释为什么媒体会话被检测为网络欺凌的评论？

数据集：Instagram(图像和用户评论) 和Vine(允许用户录制和播放几秒钟视频的移动应用网站)

为了回答问题一：我们首先比较了我们的 HENIN和基线方法。为了评估网络欺凌检测方法的性能，我们使用以下指标，这些指标通常用于评估分类器:准确性(Acc)，精度(Pre)，召回(Rec)和 F1- score (F1)。为了使实验更加稳健和可靠，我们随机选择了 80%的媒体会话进行训练，剩下的20%进行测试。我们重复这个过程 5次，并报告平均值。结果如下图所示。我们可以发现，在两个数据集上，所提出的HENIN方法在准确性、召回率和F1上始终优于竞争方法，即，除了精度度量。虽然 RF 和 RNN 分别在Instagram 和 Vince 数据集的 Precision 得分较高，但它们在其他指标上的表现并不稳定。值得注意的是，考虑注意机制的模型，即 HENIN 和 GRU+A，往往会产生更好的性能。这意味着建模上下文相关性的重要性，以及在单词或句子水平上对检测网络欺凌的贡献。

为了回答问题二，我们进一步研究了 HENIN模型中每个成分的影响。我们的目的是评估以下简化的 HENIN变体。(1)-A：HENIN，无Post Comment co-attention组件，（2）-G：没有GCN组件的HENIN，(3) -C：HENIN不带注释编码器，(4) -AG：HENIN没有Post Comment co-attention和GCN组件，(5) -CG：HENIN无注释编码器和GCN组件

结果下图所示。对海宁消融的分析带来了两个方面的启示。首先，所有这三个组件(即，评论编码器，会话-会话和 post-post 交互，以及发布的文本评论共同注意)都明显有助于性能的提高。第二，当模型不考虑会话和帖子交互的表征时，在 Instagram 上的 F1-Score 和准确性指标方面，性能降低了 14%和 9.6%，在Vine 上的性能降低了 30.7%和6%。换句话说，“-G”模型对性能的损害最大。结果表明，在 HENIN中通过GCNs 建模会话之间和帖子之间的交互是重要的。

为了回答问题三，我们检验了HENIN是否能在早期阶段准确地检测到网络欺凌。换句话说，我们的目标是理解只给出部分观察到的评论时，模型是如何执行的。这里我们选择GRU作为比较基线。具体来说，对于每个媒体会话，我们根据响应时间对所有评论进行排序，然后选择评论的不同部分进入训练集和测试集。利用 Precision@k和准确性作为评估指标

从下图可以看出，我们提出的HENIN在观察到的评论相当多的情况下(即评论的比例低于 40%)可以获得更好的性能。相比之下，GRU模型需要对两个数据集至少 50%的评论才能获得和HENIN一样好的性能。简而言之，我们证明了 HENIN能够相当准确地对网络欺凌会话进行早期检测。

为了回答问题四，我们从评论的角度评估了我们的HENIN模型的可解释性的性能。我们选择GRU+A作为评论可解释性的基线，因为它可以学习评论的注意权重作为一种可解释性。具体来说，我们想看看由我们的HENIN决定的排名靠前的可解释的评论是否更有可能与网络欺凌媒体会议的主要背景有关。

结果下图所示，其中媒体会话是根据两种方法(即NDCG@k(HENIN)−NDCG@k(GRU+A))的度量差异按降序排序的。从这些数字，我们可以有两个观察。首先，在 10 个Vine media session 中，有 6 个病例HENIN的准确率高于GRU+A。10 例以上的HENIN和GRU+A的总体精度平均得分分别为 0.51和0.41。第二，在NDCG得分上也可以发现类似的结果。7 例患者的 HENIN 优于 GRU+A, 2例患者的NDCG评分相等。10例以上HENIN和GRU+A患者的NDCG总分均值分别为 0.57 和 0.36。结果表明，与GRU+A相比，HENIN的注意力权重能够突出更多的证据性评论，其可解释性得到验证。

在下图中这些案列GRU+A丢失了。我们可以发现：(1)我们的HENIN对证据性评论的排序高于非解释性评论。例如，排名第一的评论“一个婊子告诉他，我要杀了他打女人的婊子屁股”包含了露骨的粗俗和恶意文本，可以解释为什么这个媒体会议被检测为网络欺凌。(2)可解释评论比中立评论和不相关评论具有更高的关注权重。例如，不相关的评论“Court-dawg Jimecia Bandy Donishia Phillips”的注意力权重为 0.070，低于可解释的评论“如果一个婊子用一个物体打黑鬼，我们就会报复”的注意力权重为 0.219。因此，选择后一条评论作为网络欺凌预测的更重要的证据。简而言之，HENIN 不仅能够准确地发现网络欺凌事件，而且还能突出证据性评论作为解释。

五、总结

近年来，社交媒体上的网络欺凌检测越来越受到关注。同样重要的是，要理解为什么媒体会议被检测为网络欺凌。因此，我们研究了可解释网络欺凌检测的新问题，旨在提高检测性能和突出可解释的评论。我们提出了一种新的基于深度学习的模型——异构神经交互网络(HENIN)，从评论编码、评论后共同注意以及会话与帖子之间基于图的交互中学习各种特征表示。实验结果显示了HENIN具有良好的性能和证据解释。我们还发现，学习基于图的会话-会话和 post-post 交互对性能的贡献最大。这些结果可以鼓励未来的研究开发先进的图神经网络，以更好地表示异构信息之间的交互。