本文贡献:
- 首次全面审查了用于自动假新闻检测的自然语言处理解决方案;
- 系统地分析了假新闻检测如何与现有的NLP任务保持一致,并讨论了问题不同表述的假设和值得注意的问题;
- 对可用的数据集、NLP方法和结果进行分类和总结,为对该问题感兴趣的新研究人员提供第一手经验和可访问的介绍。
1 与假新闻检测工作相关的工作
事实核查
事实核查是评估政治家、权威人士等公众人物所作声明的真实性的任务(Vlachos和Riedel, 2014)。许多研究人员没有区分假新闻检测和事实核查,因为它们都是为了评估言论的真实性。一般来说,假新闻检测通常侧重于新闻事件,而事实核查则更广泛。索恩和弗拉乔斯(2018)对这一主题进行了全面的回顾。
谣言检测
谣言检测的定义并不一致。最近的一项调查(Zubiaga et al., 2018)将谣言检测定义为将个人陈述分为谣言或非谣言,其中谣言被定义为在发布时由未经验证的信息组成的陈述。换句话说,谣言必须包含可以被证实的信息,而不是主观的观点或感觉。