论文阅读【A multi-task attention tree neural net for stance classification and rumor veracity detection】

该论文提出了一种名为MATNN的多任务注意力树神经网络,用于立场分类和谣言真实性检测。通过构建RC-Trees和自注意力机制,MATNN能有效处理谣言对话树的结构信息,结合树卷积和树池化,提升谣言检测的准确性。
摘要由CSDN通过智能技术生成

论文题目:《A multi-task attention tree neural net for stance classification and rumor veracity detection》
翻译:一种用于立场分类和谣言准确性检测的多任务注意力树神经网络

检测方法:用公众的立场判定帖子的真假。
创新:提出了一个谣言对话术

初始化解释

1 谣言对话树

谣言对话树中包含的数据分为三部分
第一部分是用户信息
第二部分是帖子的文本信息
第三部分是谣言对话树节点之间的结构信息。结构信息可以进一步建模为全局结构特征和局部结构特征。局部结构特征旨在对节点与其邻域或分支之间的结构信息进行建模,而全局结构特征则用于表示整个谣言对话树中分支的结构关系

2 立场分类

“支持”、“否认”、“评论”和“质疑”

3 谣言真实性检测

真实、虚假、未验证

树结构的探索

1 为什么要用树结构

树的结构模型更适合于根级识别。

2 树结构的探索:


①Spectal-GCN很难扩展到具有不同结构的会话树,且专注于全局结构信息和图分类任务,如谣言监测和谣言准确性检测,但是很难实现到结点分类任务,比如立场分类。
②GTA关注的是每个分支的局部特征,而不是多个会话分支之间的全局结构特征
很少有GNN是专门为谣言对话设计的,提取他们的结构特征,并在单个机器学习框架联合处理两个任务(立场判定和谣言准确率计算)

最近提出了基于调整会话树的神经网络,LSTM树和CRF树,但是这些神经网络在会话分支中近似地执行线性合并过程,而不是对多个会话分支之间的结构特征进行建模。

3 创新:树和网络

树(贡献点1)

作者提出的树:从不规则的对话树中构建完整的K-ary规则的谣言对话树。(RC-Trees)

网络(贡献点2)

基于RC树的多任务注意树神经网络。(MATNN)

立场判定思路

使用自注意力机制来提取其领域中每个节点的局部特征,并且对其进行立场分类。

谣言准确性计算思路

然后根据立场特征,设计树卷积和树池化运算,提取全局结构特征,检测谣言的准确性。

自注意力机制及树自注意的发明

相似系数、自注意系数、自注意特征。

1 相似系数

指定节点领域中特征的相似性,例如余弦相似性 ( x , y ) = x ∗ y ∥ x ∥ ∗ ∥ y ∥ (x,y)=\frac{x*y}{\left \| x \right \|*\left \| y \right \|} (x,y)=xyxy

2 自注意系数

s e l f _ a t t e n t i o n ( x , y ) = s o f t m a x ( s i m i l a r i t y ( x , y ) ) self \_ attention(x,y)=softmax(similarity(x,y)) self_attention(x,y)=softmax(similarity(x,y))

3 自注意特征

h x ( f e a t u r e ) = a c t i v e _ f u n c t i o n ( ∑ y ∈ n e i g h b o u r ( x ) s e l f _ a t t e n t i o n ( x , y ) ∗ f e a t u r e ) h_x(feature)=active\_function(\sum_{y \in neighbour(x)}self \_ attention(x,y)*feature) hx(feature)=active_function(yneighbour(x)self_attention(x,y)feature)

4 树自注意

自注意特征使用在具有规则线性结构或者网络结构的数据上,但是谣言对话结构是不规则的
所以我们设计了,树自注意力,可以用于不规则的谣言对话树。

RC-Trees谣言对话树

用户特征、帖子的文本信息和谣言对话树的结构信息

RC-Trees图
紫色是局部结构信息,蓝色是全局结构信息,红色是用户特征和文本信息。

构建

第一步,编号

层次遍历,对会话树的结点进行编号,不改变节点之间的结构关系

第二步,记录

记录所有会话树中的最大深度H和节点的度K。

第三步,构建规则

根据H和K,设计规则,所有的对话都可以转换为RC树。
①如果节点i的子节点小于K,复制节点i到节点i的子节点,直到子节点的数量达到K
②将①扩展到每个节点,直到树中每个分支的深度达到H。因此事件中的所有会话树都可以转换为H深K元的RC树。

树构建过程

构建出现的新问题以及解决办法

节点的复制虽然不会加剧立场标签的不平衡,但是会改变原始立场标签的数量和比例。

解决办法
记录RC-Trees的节点和原始会话树节点之间对应关系序列,用于将RC-Trees的标签转换为原始会话树,以检测原始会话的位置。

MATNN

网络组成

MATNN包含两个子神经网络:
一个用于立场分类的树自注意子网络
一个用于谣言准确性检测的树卷积子网络;

树自注意立场分类

RC-trees包含节点属性F和其邻接矩阵A。
f = { f 1 , f 2 , ⋯   , f N } f=\left \{f_1,f_2,\cdots,f_N \right \} f={ f

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值