论文题目:《A multi-task attention tree neural net for stance classification and rumor veracity detection》
翻译:一种用于立场分类和谣言准确性检测的多任务注意力树神经网络
检测方法:用公众的立场判定帖子的真假。
创新:提出了一个谣言对话术
初始化解释
1 谣言对话树
谣言对话树中包含的数据分为三部分
第一部分是用户信息
第二部分是帖子的文本信息
第三部分是谣言对话树节点之间的结构信息。结构信息可以进一步建模为全局结构特征和局部结构特征。局部结构特征旨在对节点与其邻域或分支之间的结构信息进行建模,而全局结构特征则用于表示整个谣言对话树中分支的结构关系
2 立场分类
“支持”、“否认”、“评论”和“质疑”
3 谣言真实性检测
真实、虚假、未验证
树结构的探索
1 为什么要用树结构
树的结构模型更适合于根级识别。
2 树结构的探索:
旧
①Spectal-GCN很难扩展到具有不同结构的会话树,且专注于全局结构信息和图分类任务,如谣言监测和谣言准确性检测,但是很难实现到结点分类任务,比如立场分类。
②GTA关注的是每个分支的局部特征,而不是多个会话分支之间的全局结构特征
很少有GNN是专门为谣言对话设计的,提取他们的结构特征,并在单个机器学习框架联合处理两个任务(立场判定和谣言准确率计算)
新
最近提出了基于调整会话树的神经网络,LSTM树和CRF树,但是这些神经网络在会话分支中近似地执行线性合并过程,而不是对多个会话分支之间的结构特征进行建模。
3 创新:树和网络
树(贡献点1)
作者提出的树:从不规则的对话树中构建完整的K-ary规则的谣言对话树。(RC-Trees)
网络(贡献点2)
基于RC树的多任务注意树神经网络。(MATNN)
立场判定思路
使用自注意力机制来提取其领域中每个节点的局部特征,并且对其进行立场分类。
谣言准确性计算思路
然后根据立场特征,设计树卷积和树池化运算,提取全局结构特征,检测谣言的准确性。
自注意力机制及树自注意的发明
相似系数、自注意系数、自注意特征。
1 相似系数
指定节点领域中特征的相似性,例如余弦相似性 ( x , y ) = x ∗ y ∥ x ∥ ∗ ∥ y ∥ (x,y)=\frac{x*y}{\left \| x \right \|*\left \| y \right \|} (x,y)=∥x∥∗∥y∥x∗y
2 自注意系数
s e l f _ a t t e n t i o n ( x , y ) = s o f t m a x ( s i m i l a r i t y ( x , y ) ) self \_ attention(x,y)=softmax(similarity(x,y)) self_attention(x,y)=softmax(similarity(x,y))
3 自注意特征
h x ( f e a t u r e ) = a c t i v e _ f u n c t i o n ( ∑ y ∈ n e i g h b o u r ( x ) s e l f _ a t t e n t i o n ( x , y ) ∗ f e a t u r e ) h_x(feature)=active\_function(\sum_{y \in neighbour(x)}self \_ attention(x,y)*feature) hx(feature)=active_function(∑y∈neighbour(x)self_attention(x,y)∗feature)
4 树自注意
自注意特征使用在具有规则线性结构或者网络结构的数据上,但是谣言对话结构是不规则的。
所以我们设计了,树自注意力,可以用于不规则的谣言对话树。
RC-Trees谣言对话树
用户特征、帖子的文本信息和谣言对话树的结构信息
紫色是局部结构信息,蓝色是全局结构信息,红色是用户特征和文本信息。
构建
第一步,编号
层次遍历,对会话树的结点进行编号,不改变节点之间的结构关系
第二步,记录
记录所有会话树中的最大深度H和节点的度K。
第三步,构建规则
根据H和K,设计规则,所有的对话都可以转换为RC树。
①如果节点i的子节点小于K,复制节点i到节点i的子节点,直到子节点的数量达到K
②将①扩展到每个节点,直到树中每个分支的深度达到H。因此事件中的所有会话树都可以转换为H深K元的RC树。
构建出现的新问题以及解决办法
节点的复制虽然不会加剧立场标签的不平衡,但是会改变原始立场标签的数量和比例。
解决办法
记录RC-Trees的节点和原始会话树节点之间对应关系序列,用于将RC-Trees的标签转换为原始会话树,以检测原始会话的位置。
MATNN
网络组成
MATNN包含两个子神经网络:
一个用于立场分类的树自注意子网络
一个用于谣言准确性检测的树卷积子网络;
树自注意立场分类
RC-trees包含节点属性F和其邻接矩阵A。
f = { f 1 , f 2 , ⋯ , f N } f=\left \{f_1,f_2,\cdots,f_N \right \} f={
f