论文阅读【Multimodal Disentangled Domain Adaption for Social Media Event Rumor Detection】-CSDN博客

本文链接：https://blog.csdn.net/qq_43691312/article/details/129248277

本文针对社交媒体事件谣言检测的挑战，提出了多模态解纠缠域自适应（MDDA）方法。MDDA通过多模态解纠缠表示学习分离内容和风格特征，并使用无监督领域自适应去除事件特定特征，以实现无标记数据下新兴事件的谣言检测。实验表明，MDDA在Twitter基准数据集上表现出优越性能。

摘要由CSDN通过智能技术生成

谣言检测存在的两大挑战

①纠缠挑战：在现实的社交媒体平台上，谣言总是与具体内容纠缠在一起。同一事件，谣言间的差异也很大。忽略了内容与风格之间的联系。
②领域挑战：已有的事件训练的模型对新发生的事件指导性效果不大(没有标签)。

社交媒体事件谣言检测任务旨在检测没有标记数据的新兴社交媒体事件的谣言。

结论

本文研究了社交媒体平台所面临的现实谣言检测场景：社交媒体事件谣言检测，目的是在没有标记数据的情况下，对新兴的社交媒体事件进行谣言检测。针对社交媒体事件谣言检测的挑战，提出了一种新的多模态解纠缠域自适应(MDDA)方法。它由两个主要部分组成：多模态解纠缠表征学习和无监督域自适应。多模态解纠缠表示学习负责将多媒体帖子分解为事件内容信息和谣言写作风格信息。无监督领域自适应是去除事件特有的特征，保持事件之间共享的谣言风格特征。在两个Twitter基准数据集上进行的大量实验表明，我们的谣言检测方法比现有的方法取得了更好的结果。

初始化定义

训练 $D_{S}=\left \{p^i,y^i \right \}_{i=1}^{N_{S}}$

S为事件
$N^S$ 为此事件的帖子数量
$p^i$ ，事件下的一个帖子，由 $x^i$ 和 $v^i$ 文本和图片共同组成
$y^i\in\left (0,1\right )$ ，此帖子的标签

实验 $D_{T}=\left \{p^i,y^i \right \}_{i=1}^{N_{T}}$

T为要检测的新事件
$N^T$ 为此事件的帖子数量

方法

模型组成

①多模态解纠缠表示学习

删除统一事件，不用帖子的不同特征，保留分析不变内容的谣言风格特征。

②无监督领域的适应

采用对抗性神经网络学习的领域自适应，从多媒体帖子中学习可转移的特征。基于谣言风格特征，训练检测器。

多模态解纠缠表示学习

表现不佳的原因是，每个帖子都有自己的内容，如果都要参考的话，那么对于训练出来的数据模型，表现都不会好。
所以这个结构的主要作用就是将内容和风格分割出来，用风格进行训练。针对文本和图片要进行分别解纠缠。

①文本解纠缠表示学习

变分自动编码器作为基本模型。三种特殊的编码器。
第一个是普通的编码器 $E_{X}^{b}$ ，学习文本的潜在分布
第二个是内容编码器 $E_{X}^{c}$ ，学习文本内容
第三个是风格样式编码器 $E_{X}^{S}$ ，学习谣言写作风格。

疑难杂症

①RNN、LSTM、GRU

零基础上手RNN、LSTM

模型结构

模型结构图
所提出的多模态解纠缠域自适应（MDDA）方法的说明。MDDA首先执行多模态解纠缠表示学习，将多媒体表示帖子分离为内容特征和风格特征，并删除特定于内容的特征进行训练。如果没有对内容信息的干扰，仅从风格特征中训练出来的谣言分类器就会更加精确和健壮。
然后采用基于对抗性学习的领域自适应来处理不同事件上的风格表示分布漂移。通过这种方式，MDDA可以处理社交媒体事件的谣言检测任务，并在新出现的事件中持续表现良好。
红线是推理管道。一旦模型被训练，目标数据可以直接输入样式编码器和标签预测器，以得到标签预测。