一、创新点和主要内容
- 利用卷积神经网络和注意力机制对推文的文本内容进行编码得出立场预测,使用RNN(双向GRU)和注意力机制对推文序列进行学习,最后结合两个子模型进行谣言的预测。
- 检测过程分为两步:根据推文的文本内容、时间戳和目标推文的顺序对话结构得出每条推文的stance;然后使用conversation中所有推文的stance来对原始谣言的真假进行预测。
二、模型介绍
1、数据集
- pheme数据集的一部分
2、立场预测
- 结合文本表示、上下文表示、时间特性学习得到推文的立场。
- 立场检测架构图
- 文本编码器——得到文本表示(输入到序列编码器、谣言预测子模型)
- 将一个推文表示为单词的集合{w
i
};通过嵌入层将推文表示为词向量集合{Vi
^^}(使用预先训练好的glove embedding初始化单词向量,训练期间对其进行调优,以捕获特定任务的内在特征);对词向量使用一层卷积层、tanh函数学习特征;进入注意力机制(词向量级别);将所有学习到的词向量特征连接起来,得到推文的文本表示。