《Unified Dual-view Cognitive Model for Interpretable Claim Verification》
这篇文章是发表在2021年ACL上的,主要从认知的角度 Collective and Individual Cognition (CICD) 提出了Dual-view model解决Claim Verification任务。
分以下部分介绍:
- Motivation
- Introduction
- Model
- Experiment
- Discussion
1、Motivation
-
最近的工作都是直接构造claim(C)和 Personal response(R)之间的关联关系。但是考虑到不同的个体的回复,传递的是不同个体视角下的信息。
-
然而个体的信息总是会带有一定的偏置,并不能很好的反映客观事实。
-
在这篇文章当中,我们提出一个模型,它是基于合作个体认知理论去对 claim verification进行解释。包括局部的证据信息和全局的证据信息。
2、Introdcution
研究意义
文章在introduction部分首先说明了claim verification的重要性,比如说疫情期间有很多的这个谣言,怎么去对这个网络上迅速传播的一些声明去进行验证,是一个很关键的问题。
相关工作
接着说明当前的方法主要分为两类:
-
第1类是依赖于传统的机器学习和深度学习的方法去捕获语义,情感。书写风格等等。但是这种方法很难去做一些合理的解释,对于结果。
-
第2种方法是为了解决上述提到的问题,很多的研究者会聚焦,在可解释性上,主要是在声明和每一个用户的表达之间去建立一个交互模型。包含相似,矛盾或者中立。
出发点
但是考虑到个体的一个视角或者声明,并不能够很好的反映一些客观的事实。如果只用这些对应的个人的声明去做下游任务,表现会较差。作者在这个地方举了一个例子,说不仅仅蚊子会传播热血症(?),然后空气中可能也会传播。
接着存在一些用户个人(Local)的一些回复,然后可以发现这些用户之间的回复其实都是带有一些主观性,那么如何从这些所有的用户去挖掘一个他们集体的视角(Global)是一个比较重要的挑战,在这个地方作者就算是引出了本文的一个研究目标。
解决方案
为了解决这个问题,作者提出了一个联合的CICD模型,同时还提出了一个损失函数,基于KL散度拟合全局的证据和局部的证据。
这个地方把全局的证据概率分布当做是真实事件的概率,局部的证据概率分布当做是拟和全局证据的分布。
3、Model
模型部分的话其实比较简单,主要是包括以下几个模块。
- CED模块(Collective Cognition View-based Encoder-Decoder)
- ISI 模块(Individual Cognition View-based Selected Interaction)
- Dual-View Classification
每个模块所运用到的方法也是一些现有的方法。
CED模块
输入: 包括所有用户评论的串联和声明,这一部分的输入会通过CED模块,
目的: 是为了获取全局的证据信息。
这个地方包含一个编码器和一个解码器,在编码器部分包含词级别的信息以及句子级别的信息,通过使用attention的操作来过滤掉和声明不相关的个体的回复。得到不同层次的语义信息之后,将这两部分的语音信息进行融合在进行解码生成对应的generated sequence。这些向量用来表示全局证据当中丰富的语义信息,即
G
G
G。
ISI 模块
输入:每个个体的回复和声明作为输入
目的:是为了捕获这些单个个体之间的局部信息。
通过selected mechanism选择Top K的article。再通过一个协同注意力网络对这些article进行交互,得到最终的local evidence fragments,即
I
I
I。
Dual-View Classification
接下来会增加一个新的Loss,基于KL散度进行计算。
最终的损失函数:
4、Experiment
(1)主实验
(2)ablation study
(3)Co-Interactive 的比较
(4)可视化实验
其中图5(a)是CED模块生成的序列,图5(b)和图5(c)中突出显示的单词分别是:
- CICD捕获的用于解释结果的单词
- ISI模块计算的证据片段的单词。
5、Discussion
-
这篇文章的问题定义的比较清楚,同时将认知当中的个人和合作理论去进行模型的构建,并且对Claim verification任务据进行解释。最终取得了一定的效果。
-
模型部分设计,虽然复杂,但是里面的内容基本上都是一些常规的操作,没有给人带来非常新异的feeling。
-
虽然说是可解释,但是用的还是一些attention,只不过在最后给了一个例子去表示模型,关注的是哪些内容的信息,但是这个其实就是attention本来就有了一个效果,所以说这个可解释到底是什么,还是有待继续探索的。
Reference
[1] Unified Dual-view Cognitive Model for Interpretable Claim Verification