基于序列标注的事件联合抽取方法
王晓浪1,邓蔚1,2,胡峰1,邓维斌1,张清华1(1.重庆邮电大学 计算智能重庆市重点实验室,重庆400065;2.西南财经大学 统计研究中心,成都611130)
重庆邮电大学学报(自然科学版) 北大核心 CSCD
1 摘要
提出一种基于序列标注的事件联合抽取模型,结合卷积神经网络(convolutional neural networks,CNN)与长短期记忆网络(long short-term memory,LSTM)提取全局特征和局部特征;并在浅层LSTM层共享参数实现联合抽取,以序列标注方式抽取事件论元并匹配事件类型。
2 模型
3 实验
为了验证本文方法的性能,在司法数据集上做了3组实验,分别为基准对比实验,网络模型对比实验,联合抽取与管道方式的对比实验,并在金融数据集上与基准实验对比,验证文中方法的可移植性
3.1 数据集
实验使用的司法数据集来自法律网站裁判文书网(http:/ /www.wenshu.com/),网 站 数 据 包 含 法 律案件和争议焦点以及关键字。争议焦点是司法案件中需要解决的主要问题,以事件抽取方式抽取答辩状中的争议焦点,并将争议焦点和争议焦点中的参与者分别作为事件类型与事件论元。
3.2 流程
3.3 实验结果