作者发现FrameNet中定义的框架与用于事件抽取模型效果评估的ACE数据集中的事件结构具有很高的相似度,由此提出使用FrameNet中的知识来自动产生带有标注的数据,对原数据进行扩展,发现应用相同模型时,使用加入新数据后训练的模型效果有了显著的提升。
FrameNet是一个语言资源库,一个Frame由一个词法单元(Lexical Unit)和多个框架元素(Frame Elements)构成,这与一个句子中要抽取一个trigger与多个arguments的思路十分相似。作者首先使用ACE的语料训练了一个3层的神经网络模型用以Event Detection,然后使用该模型对FrameNet中的15000多个句子进行类型识别,得到初始分类结果。随后,通过以下假设对初始分类结果进行修正:
- 属于同一个词法单元的句子倾向于表达相同类型的事件;
- 属于相关Frame的句子倾向于表达相同类型的事件;
- 在同一个Frame下的句子倾向于表达相同类型的事件。
使用修正后的分类结果来扩展原有的ACE库,并将自己的模型在使用扩展数据前后与DMCNN等模型进行了比较。