论文地址:https://www.microsoft.com/en-us/research/wp-content/uploads/2016/07/12818-57567-1-PB.pdf
摘要
常识因果推理是捕捉和理解事件和动作之间因果依赖关系的过程。这种事件和动作可以用自然语言文本中的术语、短语或句子来表达。因此,获得因果知识的一种可能方式是从大的文本语料库中提取术语或短语之间的因果关系。然而,文本中的因果关系是稀疏的、模糊的,有时是隐含的,因此很难获得。本文采用数据驱动的方法研究短文本(短语和句子)之间的常识因果推理问题。我们提出了一个框架,从一个大的网络语料库中自动获取因果关系术语网络。在这个网络的支持下,我们提出了一个新颖有效的度量标准来正确地建模术语之间的因果关系强度。我们表明,这些信号可以被聚集起来,用于短文本之间的因果推理,包括句子和短语。特别是,我们的方法在标准的SEMEVAL COPA任务中优于以前报告的所有结果。
COPA:《Choice of Plausible Alternatives: An Evaluation of Commonsense Causal Reasoning》 COPA由一大套2选问题组成,表述为一个前提,两个备选方案写成简单的英语句子。任务是选择更可能是前提所描述的情况的原因(或结果)的替代方案。
1 Introduction
3点贡献:
1.通过利用因果线索,我们从大型网络文本中获得了一个基于术语的因果共现网络;
2.我们开发了一种新