作者:崔金满 单位:燕山大学
论文链接:https://www.aclweb.org/anthology/D19-1033/
代码地址:https://github.com/thunlp/TLNN
数据集:ACE 2005 和 KBP 2017 (中文语料)
来源:EMNLP 2019
事件检测包括触发器识别和对事件提及进行分类两个子任务,对于没有分隔符的中文来说主流的方法是基于词汇的模型,即首先对句子进行分词,然后再执行后续任务。
针对问题:
- 触发词不匹配问题:如一个触发器属于一个词的一部分,或者由多个词组成。在下图中,“射”和“杀”两个触发器分别对应两个不同的事件,却在中文分词过程中往往会将其分为一个词“射杀”;