GCAN:使用图注意力网络来做社交媒体虚假新闻检测
Abstract
主要任务:给定短文本的推特和一系列用户的转播链来判断是不是虚假新闻,并且对虚假新闻检测做一些解释性研究。
模型:GCAN 主要包括GCN,co-attention模块
Introduction
基于的思想主要是源推特的情感和观点应该会被用户的参与和交互反映(主要强调了交互特征的作用),集体智能!
现有的虚假新闻检测方法主要需要很丰富的用户评论来补充和分析推特的观点,检测虚假新闻,还有些需要很长的文本来提取信息。现在最好的模型是dEFEND,它可以生成合理的解释(对检测假新闻),但是需要长文本和用户评论。
我们模型的亮点:
- 只需要短文本的推特
- 不需要用户评论
- 没有社交网络等
- 有可解释性(使用dual co-attention mechanism)
Related work
主要分为 comment-based,User-based,Structure-based和Hybrid-based
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4I19kYp2-1617382675529)(D:\study\论文\multimodal\GCAN\QQ截图20210403002411.png)]
Model
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AXuyt4Va-1617382675534)(D:\study\论文\multimodal\GCAN\QQ截图20210402152717.png)]
首先是个User characteristics Extraction, 对每个用户来构建特征向量。包括
- 用户自我介绍的字数
- 用户名的长度
- 用户关注的人数
- 关注用户的人数
- 用户发布的条数
- 用户发布第一条推特的时间
- 用户的账户有没有验证
- 用户是否允许地理空间位置
- 原推特的转发时间
- 转发推理链的距离
这样就构建了用户向量x
然后对输入的推特文本内容encoding,使用简单的仿射变换,激活函数是tanh。然后输入GRU中提取信息
User propagation representation: 使用CNN-based或者GRU-based,两个版本,图中看的很清楚。CNN对于局部信息提取更好,GRU对于序列信息提取更好,就是对于转播途径的局部结构和整体的序列结构都有一个特征提取。
Graph-aware propagation representation : 使用图神经网络来提取传播链的空间结构。
Dual Co-attention Mechanism: 双重注意力机制,
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kHp9zF33-1617382675536)(D:\study\论文\multimodal\GCAN\QQ截图20210403004723.png)]
首先是一个双重交叉的仿射变换,对交叉特特征做softmax得到权重,加权得到最终的特征向量(交互方面就是最开始的放射变换,其实并没有特征完全的交叉)
Make prediction :就是简单的全连接输出分类结果,使用交叉熵损失函数。
Experiment
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Z7Tg1P9C-1617382675539)(D:\study\论文\multimodal\GCAN\QQ截图20210402152603.png)]
效果好的可怕!!!
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4oXf3lFo-1617382675541)(D:\study\论文\multimodal\GCAN\QQ截图20210403005129.png)]
少样本的训练也很好
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AZj0hA3Y-1617382675543)(D:\study\论文\multimodal\GCAN\QQ截图20210403005217.png)]
消融实验—S-A是没有推特embedding和dual co-attention. -A是dual co-attention, -R和-C是用户特征提取,-G是图神经网络。结果是-S-A最重要。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FtvoeENp-1617382675545)(D:\study\论文\multimodal\GCAN\QQ截图20210403005450.png)]
可解释性研究,主要是attention向量的表示。
Learn from paper
优点就是对数据的要求不是那么苛刻,然后效果确实太好了。。。。
解释性研究,主要是attention向量的表示。
Learn from paper
优点就是对数据的要求不是那么苛刻,然后效果确实太好了。。。。
改进点可能是用户特征的构建比较简单了?其实还可以做一下用户是不是机器人的检测,或者对用户过往的转发和原创内容中虚假新闻的比例来对用户进行虚假等级标注之类的。(但是可能就不是端到端了)