该论文发表于2005年,属于早期论文
一、论文要解决的问题
从文本中的成对实体之间抽取存在的关系
二、文章使用的方法(亮点、创新点)
使用核方法,并多个核融合在一起,组合了多个不同的语法处理的特征
语法处理
- 词语切分(tokenization)
- 句子解析(sentence parsing)
- 深度依赖关系分析(deep dependency analysis)
处理的任务
2004 ACE relation detection task
比较前人成果
- 句法分析可以找到仅基于单词序列不容易识别的关系。但是,随着处理过程加深,精度会越来越低。所以,低层次的处理相对来说会获得更高的准确度(Collins et al. 1997 and Miller et al. 2000 )
- 一种基于浅层解析树的递归核方法,核匹配从两棵子树的根开始并递归到树叶的节点,用于检测人之间关系和组织位置关系。相比于深层解析树,浅层解析更可靠,但是它容易受解析错误的影响,即解析错误的累加会对检测结果造成严重影响。(Zelenko et al. 2003)
- 由于(Culotta and Sorensen 2004 )的核是从依赖关系树的根到实体节点所在的叶的递归匹配,因此两个关系示例的成功匹配要求它们的实体节点处于树的相同深度。这是一个非常强的限制,所以结果精度很高但是召回率很低。词袋模型可以抵消这个问题。本篇论文使用了更多灵活的核方法来捕获语法规则,并考虑了更多的语法信息。