Lan GAGE和智能挑战2021(LIC2021)中的多格式信息抽取(IE)任务由三个子任务组成:关系抽取(RE)、句子级事件抽取(SENTEE)和文档级事件抽取(DOCEE)。深度学习方法在每个子任务中都取得了很大的进步。然而,它们中的大多数无法通过统一的平台解决这些子任务。在本文中,我们开发了一个具有两阶段过程的统一神经模型,该模型在第一阶段采用增强的NER模块来获得元素和相应的标签。在两个阶段中,我们解决了不同的问题。提交的资料表明,我们的模型取得了有竞争力的性能,在最终排行榜上排名第三。
在本文中,我们报告了在LIC2021中多格式信息提取任务的解决方案。我们分析了每项任务的挑战,并为不同格式的IE设计了一个统一的平台。提出的平台可以概括为两个阶段。首先,利用增强的NER模块提取所有元素和标签。其次,根据不同的IETask和数据集定制策略。所提出的方法获得了竞争性能,在测试集1和测试集2上分别排名第2和第3。
文章地址:https://mamqgc51pm.feishu.cn/file/boxcn5ZAj1xTE1nvjscG1wk9Vpc
A Unified Platform for Information Extraction with Two-Stage Process
最新推荐文章于 2024-07-15 10:30:34 发布