1 Detect Rumors Using Time Series of Social Context Information on Microblogging Websites
- 时间:2015
- 定义:真实值无法验证或故意虚假的陈述
- 定义来源:N. DiFonzo and P. Bordia. Rumor psychology: Social and organizational approaches. American Psychological Association, 2007
- 数据集:使用了Castillo等人发布的公共数据集和自己收集的数据集(从新浪社区管理中心,应该就是微博辟谣平台),数据包括虚假的谣言信息和正常信息(非谣言)
- baseline:
- DT:决策树分类器 C. Castillo, M. Mendoza, and B. Poblete. Information credibility on Twitter.
- RF:随机森林分类器 Prominent features of rumor propagation in online social
media - RF-ext:RF的扩展,添加了社会背景
- SVM-RBF:基于支持向量机的RBF核模型 Automatic detection of rumor on Sina Weibo.
- SVM S a l l D S T ^{DST}_{Sall} SallDST:支持向量机 False rumors detection on Sina Weibo by propagation structures.
2、Detecting rumors from microblogs with recurrent neural networks
- 时间:2016
- 定义:真实价值未经证实或故意虚假的故事或陈述
- 定义来源:G.W. Allport and L.J. Postman.The psychology of rumor
- 数据集:英文数据集是从www .snopes.com辟谣网站上得到的和中文数据集从新浪社区管理中心,应该就是微博辟谣平台得到的(错误消息 假消息 misinformation),数据包括虚假的谣言信息和正常信息(非谣言)
- baseline:
- SVM-TS:线性分类器SVM Detect Rumors Using Time Series of Social Context Information on Microblogging Websites
- DT-Rank:决策树分类器 Early detection of rumors in social media from enquiry post
- DTC 和 SVM-RBF:使用决策树分类器的 Twitter 信息可信度模型 [Castillo et al.Information credibility on Twitter. 2011] 和带有 RBF 内核的基于 SVM 的模型 [Yang et al.Automatic Detection of Rumor on Sina Weibo, 2012]
- RFC:随机森林分类器 [Kwon et al., 2013] Prominent Features of Rumor Propagation in Online Social Media
3、Detect Rumors in Microblog Posts Using Propagation Structure via Kernel Learningc
-
时间:2017
-
定义:unverified and instrumentally relevant informationstatements in circulation(没翻译明白)流通中未经验证且与工具相关的信息陈述。文章后边将检测目标定为检测四类:假谣言、真谣言、未经验证的谣言和非谣言
-
定义来源:Nicholas DiFonzo and Prashant Bordia. 2007. Rumor,gossip and urban legends
-
数据集:自己收集数据集Twitter15 Twitter16(抛弃了不受欢迎的数据,选择热门数据),并用于针对包含相关推文的给定事件对谣言和非谣言进行二元分类,然后根据谣言揭穿网站(如snopes.com、Emergent.info)将数据集分为四类
-
baseline:
- SVM-TS:线性分类器SVM Detect Rumors Using Time Series of Social Context Information on Microblogging Websites
2.DTR:一种基于决策树的排名方法,用于识别趋势谣言(zhao et al,Enquiring minds: Early detection of rumors in social media from enquiry posts 2015) - DTC 和 SVM-RBF:使用决策树分类器的 Twitter 信息可信度模型 [Castillo et al.Information credibility on Twitter. 2011] 和带有 RBF 内核的基于 SVM 的模型 [Yang et al.Automatic Detection of Rumor on Sina Weibo, 2012]
- RFC:随机森林分类器 Sejeong Kwon, Meeyoung Cha, and Kyomin Jung. 2017. Rumor detection over varying time windows.
- GRU: 基于内容的谣言检测方法 Ma et al Detecting rumors from microblogs with recurrent neural networks
- BOW:一个简单的基线,我们使用词包表示每个树中的文本,并使用线性支持向量机构建谣言分类器
注:用Weka实现DTC和RFC,用LibSVM实现SVM模型,用Theano实现GRU。
4、Rumor Detection on Twitter with Tree-structured Recursive Neural Networks
- 时间:2018
- 定义:在人群中出现和传播的真实值未经验证或故意虚假的信息
- 定义来源:Nicholas DiFonzo and Prashant Bordia. 2007. Rumor,gossip and urban legends
- 数据集:自己收集数据集Twitter15 Twitter16
- baseline:
- DTR:Zhao等人(2015)提出了一种基于决策树的排名模型,通过搜索查询短语来识别趋势谣言。
- DTC:使用决策树分类器的信息可信度模型(Castillo等人,2011),基于手动工程推文的各种统计特征。
- RFC:随机森林分类器,使用3个拟合参数作为时间属性,以及一组关于用户、语言和结构属性的手工特征(Kwon等人,2013)。
- SVM-TS:一种线性支持向量机分类器,使用时间序列对手工制作的社会背景特征的变化进行建模(马等人,2015)。
- SVM-BOW:我们通过使用文字包表示文本内容和使用线性支持向量机进行谣言分类来建立一个简单的基线。
- SVM-TK和SVM-HK:SVM分类器分别使用树核(Ma等人,2017)和混合核(Wu等人,2015),这两种模型都使用核来模拟传播结构。
- GRU-RNN:一种基于递归神经网络的检测模型(马等人,2016),带有GRU单元,用于通过建模相关帖子的序列结构来学习谣言表示。
- BU-RvNN和TD-RvNN:分别是我们的自底向上和自顶向下的RvNN模型。
注:源代码公开https://github.com/majingCUHK/Rumor_RvNN
5、Detect Rumor and Stance Jointly by Neural Multi-task Learning
注:将谣言检测和立场分类联合起来,使用权重共享联合训练两个任务,以提取常见和任务不变的特征,而每个任务仍然可以学习其特定于任务的特征
- 时间:2018
- 定义:unverified and instrumentally relevant informationstatements in circulation(没翻译明白)流通中未经验证且与工具相关的信息陈述
- 定义来源:Nicholas DiFonzo and Prashant Bordia. 2007. Rumor,gossip and urban legends
- 数据集:对于liu et al 的公共数据集进行扩充,并且很久谣言鉴别网站(Snopes.com、Emergent.info 等)将数据集分为四类,非谣言、未鉴定、真谣言、假谣言;2017 年假新闻挑战赛数据集
- baseline:
- DTR:一种基于决策树的排名方法,通过搜索查询短语来识别趋势谣言 。
- DTC 和 SVM-RBF:分别使用决策树分类器 的 Twitter 信息可信度模型和带有 RBF 内核的基于 SVM 的模型 ,两者都使用基于帖子整体统计的各种手工特征。
- RFC:随机森林分类器,使用三个参数来拟合时间属性和一组关于用户、语言和结构特征的手工特征。
- SVM-TS:一种线性 SVM 分类模型,它使用时间序列来模拟一组手工特征的变化 [33]。 MT-US:我们采用统一共享层架构的多任务模型。
- MT-ES:我们的具有增强共享层架构的多任务模型。
- MT-single:我们的 MT-US 模型,去除了姿态分类组件。这简化为现有的基于 [32] 中提出的 RNN 的单任务谣言检测模型。
6、Utilizing computational trust to identify rumor spreaders on Twitter
这篇文章是检测传播者的,暂时不细看
7、Detect Rumors on Twitter by Promoting Information Campaigns with Generative Adversarial Learning
- 时间:2019
- 定义:真实价值未经证实或故意虚假的故事或陈述
- 定义来源: G.W. Allport and L.J. Postman. 1965. The psychology of rumor. Russell & Russell.
- 数据集:使用pheme数据集和Ma et al等人2016年论文中收集的数据集(虚假谣言)
- baseline:
- DT-Rank:一种基于决策树的排名方法,通过搜索有争议的声明来识别趋势谣言 。
- DTC:一个决策树分类器,用于使用各种手工制作的特征对 Twitter 信息可信度进行建模。
- SVM-TS:一种线性 SVM 分类模型,使用时间序列对社会背景特征的时间变化进行建模 。
- BOW:使用词袋表示文本并使用线性 SVM 构建谣言分类器的简单基线。
- GRU:一种基于 RNN 的谣言检测模型,带有 GRU,用于随时间推移对相关帖子进行表征学习。
- CNN:一种基于 CNN 的错误信息识别模型 ,用于通过将相关帖子构建为固定长度序列来学习谣言表示。
- GAN-GRU、GAN-CNN 和 GAN-BOW:我们的 GAN 式学习模型,其中判别器分别采用上述数据驱动模型 GRU、CNN 和 BOW。由于将 GRU 替换为 CNN 或 BOW 作为判别器很简单,因此我们省略了对 GAN-CNN 和 GAN-BOW 的结构的描述。
注:原码公开:https://github.com/majingCUHK/Rumor_GAN
8、An Attention-based Rumor Detection Model with Tree-structured Recursive Neural Networks
- 时间:2019
- 定义:真实价值未经证实或故意虚假的故事或陈述
- 定义来源: G.W. Allport and L.J. Postman. 1965. The psychology of rumor. Russell & Russell.
- 数据集:基于Twitter15 Teitter16,添加传播等内容,并且添加四类标签(非谣言、真谣言、假谣言、未确定);Pheme
注:数据集链接:
Twitter15&16: https://www.dropbox.com/s/7ewzdrbelpmrnxu/rumdetect2017.zip?dl=0,
Weibo : https://www.dropbox.com/s/46r50ctrfa0ur1o/rumdect.zip?dl=0. - baseline:
- DT-Rank:一种基于决策树的排名方法,通过搜索有争议的声明来识别趋势谣言 。
- DTC:一个决策树分类器,用于使用各种手工制作的特征对 Twitter 信息可信度进行建模。
- R F C:随机森林分类器,它使用三个拟合参数作为时间属性和一组基于用户、语言和结构属性的手工制作的特征 。
- SVM-TS:一种线性 SVM 分类模型,使用时间序列对社会背景特征的时间变化进行建模 。
- SVM-BOW:我们通过使用词袋模型表示文本内容并使用线性 SVM 进行谣言分类来构建一个简单的基线。
- CPCV:一种基于可信度传播网络的新闻验证模型 [21],通过探索推文中的冲突观点。
- SVM-TK 和 SVM-HK:分别使用树内核 [34] 和使用混合内核 [50] 的 SVM 分类器,两者都试图通过内核学习来捕获传播结构。
- GRU-RNN 和 HAS-RNN:基于循环神经网络 [32] 的谣言检测模型,具有通过对相关帖子的顺序结构建模来学习谣言表示的 GRU 单元,以及具有一组社交特征的分层注意网络 [15] ,分别是基于非注意力的 GRU-RNN 用于谣言检测的扩展。
- BU-RvNN 和 TD-RvNN:我们分别提出了自下而上和自上而下的 RvNN 模型
- BU-RvNN-GA 和 TD-RvNN-GA:我们的 BU-RvNN 和 TD-RvNN 扩展模型,分别具有全局注意机制
- BU-RvNN-HA 和 TD-RvNN-PA:我们分别对使用 Hierarchical Attention 的 BU-RvNN 模型和使用 Path Attention 的 TD-RvNN 模型进行了扩展