基于卷积神经网络的谣言检测,刘政、卫志华、张韧弦,《计算机应用》-2017
主要内容(与周志远2018类似)
- 使用Majing数据集
- 将谣言事件向量化,改进传统的卷积层过滤操作,使用CNN进行谣言检测
本文模型
模型结构
- 数据集处理
- 通过新浪微博官方辟谣平台取得某条具体的谣言
- 对其相关的微博进行聚类,得到N个谣言事件
- 取得跟谣言事件数目近似相同的M个非谣言事件
- 将每一个事件作为一个整体,对其中的每一条微博向量化,组成一个输入矩阵,以此类推,完成向量化操作
- 输入卷积神经网络模型进行训练
- 实际上本文是直接采用了Majing等人的数据集,做了一些预处理(正则表达式匹配降噪)
- 具体模型
- 一个卷积层+一个池化层+一个全连接层(softmax)
- filter宽度=输入矩阵的宽度:矩阵每一行表示某一条微博的向量表示,比起filter扫描局部块(注重微博事件中词与词的关系),能更好的挖掘相关微博之间的特征。