2020语言与智能技术竞赛-事件抽取方案整理(第一波

最新推荐文章于 2024-07-08 08:00:00 发布

zenRRan

最新推荐文章于 2024-07-08 08:00:00 发布

阅读量2.1k

点赞数 1

来自：深度学习的知识小屋

2020语言与智能技术竞赛--已经缓缓落下了帷幕，在此次比赛中，主办方引入了事件抽取任务, 吸引了非常多的队伍加入比赛，而赛后各位参赛大佬也陆续分享出了自己的比赛方案，因此小编在这里做一小波的汇总~（期待更多的分享！！！！）

比赛链接: https://aistudio.baidu.com/aistudio/competition/detail/32?isFromCcf=true

介绍方案之前先来看看此次事件抽取的任务具体是什么:

具体任务

本次比赛事件抽取的具体任务为识别出句子中的事件类型，并标注出该事件对应的事件论元，例如时间、地点、人物等，如下例所示: 输入:

{
   "text":"历经4小时51分钟的体力、意志力鏖战，北京时间9月9日上午纳达尔在亚瑟·阿什球场，以7比5、6比3、5比7、4比6和6比4击败赛会5号种子俄罗斯球员梅德韦杰夫，夺得了2019年美国网球公开赛男单冠军。",
   "id":"6a10824fe9c7b2aa776aa7e3de35d45d"
}

输出:

官方baseline

链接: https://github.com/PaddlePaddle/Research/tree/master/KG/DuEE_baseline
PaddleHub版本: https://github.com/PaddlePaddle/Research/tree/master/KG/DuEE_baseline/DuEE-PaddleHub

官方baseline是基于PaddlePaddle完成的，具体是通过Pipelined的方法，即基于序列标注方法先进行事件检测(ed), 然后进行论元的识别来完成事件抽取。除了github的代码外，主办方还贴心地提供了AiStudio下的baseline演示系统:

AI Studio 基线系统示例
- https://aistudio.baidu.com/aistudio/projectdetail/357419
AI Studio 基线系统示例（基于PaddleHub）
- https://aistudio.baidu.com/aistudio/projectdetail/381711

苏剑林: 将EE建模为普通的实体标注问题

链接: https://kexue.fm/archives/7321
代码: https://github.com/bojone/lic2020_baselines/blob/master/ee.py

这里介绍苏神的分享方案！苏神在自己的博客中对阅读理解、关系抽取和事件抽取都给出了自己的baseline(膜大佬！！！)。对于事件抽取，由于此次任务并不需要识别出事件触发词而是只需要识别出事件类型和事件论元，因此苏神将其建模为一个序列标注问题。具体的数据处理方式和基本模型，都可以在代码中找到: https://github.com/bojone/lic2020_baselines/blob/master/ee.py