事件抽取（and 检测）经典论文

最新推荐文章于 2024-01-29 09:06:21 发布

YingJingh

最新推荐文章于 2024-01-29 09:06:21 发布

阅读量1.7k

点赞数 1

分类专栏：论文记录文章标签：深度学习人工智能自然语言处理

本文链接：https://blog.csdn.net/Hekena/article/details/126152363

版权

论文记录专栏收录该内容

147 篇文章 9 订阅

订阅专栏

事件抽取

事件mention——要做事件抽取的原始语料
事件type——攻击、裁员等等
事件触发词——裁员
事件论元——角色+论元

{
    "text": "雀巢裁员4000人：时代抛弃你时，连招呼都不会打！",
    "id": "409389c96efe78d6af1c86e0450fd2d7",
    "event_list": [
        {
            "event_type": "组织关系-裁员",
            "trigger": "裁员",
            "trigger_start_index": 2,
            "arguments": [
                {
                    "argument_start_index": 0,
                    "role": "裁员方",
                    "argument": "雀巢",
                    "alias": [
                        
                    ]
                },
                {
                    "argument_start_index": 4,
                    "role": "裁员人数",
                    "argument": "4000人",
                    "alias": [
                        
                    ]
                }
            ],
            "class": "组织关系"
        }
    ]
}

开头言

事件抽取可以认为是多关系对的抽取，可以转换的任务范式有：基于序列标注的方法（苏剑林之前提出的一种，将触发词视为论文角色，实体类型为：事件类型+论元角色，实体为论元）
事件抽取可以分为pipeline和联合方法吧
在后边看论文的过程中，发现事件检测和事件抽取是作为两种不同的任务形式来分析的，event detection是检测事件，一般集中在trigger上，事件抽取是识别句子中包含的事件信息，不仅集中在trigger，还有，arguments。

Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks（2015-ACL）——语义表示

这篇文章的核心类似于PCNN的方法，是动态pooling的方法。在CNN网络中，分段最大池化。
因为是2015的文章，所以文章的创新点还是在embedding，如何得到捕捉到句子中重要信息的embedding？
传统中，还是语义的embedding+position embedding+event type feature。

动机

如果使用基础的CNN模型，那么，对整个句子做池化时，只能捕捉到句子最重要部分的信息。但是，句子中的触发词和论元都很重要，也就是可以理解为，句子中的重要信息，不仅只有一个，不能只用一个window size的max pool做信息提取。

方法

建模形式为两阶段的多分类任务，第一个阶段是触发词分类，第二个阶段是论元分类。
在论元分类中，根据候选论元和预测的触发词将整个句子分为3个部分。——判断候选论文的类型和角色
在触发词分类中，根据候选触发词将整个句子分为两部分，trigger之前的句子和trigger之后的句子。——对候选触发词做分类。
（看模型图，感觉和PCNN也类似）
在这里插入图片描述

Event Detection and Domain Adaptation with Convolutional Neural Networks（ACL-2015）——语义表示

论文核心：使用CNN模型表示句子语义信息。
任务是，将句子中的trigger word的识别建模为分类问题，使用CNN网络得到句子的语义信息，然后做多分类。至于领域迁移，文中没有做出任何改变，只是认为CNN获得的特征在Domain adapation中会有帮助。
Given a sentence, for every token in that sentence, we want to predict if the current token is an event trigger。

Event Nugget Detection with Forward-Backward Recurrent Neural Networks——语义表示

这篇文章主要是为了解决当triggerword是由多个token组成的条件，如何识别事件的trigger word？
根据trigger nugget(触发块）可以将整个句子分为3部分，其一是左边的context，其二是event nugget，其三是右边的context。
**事件trigger nugget的识别可以建模为分类问题，即给定candidate的条件下，判断是否为trigger，以及其类型。**这篇文章的核心做法是，根据trigger nugget将整个text分为3部分，对每一部分，使用独立的RNN模型生成语义表示向量，然后，做concatenate,得到句子的向量表示，之后完成分类，具体是a fully connected neural network with a softmax output node that classifies each event candidate as an event of specific type or a non-event.

动机

在原始的trigger识别中，如果是单个word，则对单个word做分类，如果是多个word构成了事件的trigger，则将事件的trigger改写为“word1_word2_word3”，比如，the phrase “kick the bucket” is concatenated
into a single token “kick_the_bucket”.

A Language-Independent Neural Network for Event Detection（ACL2016）——语义表示

事件抽取的挑战：因为同一个事件可能以各种触发器表达式的形式出现，而一个表达式可能在不同的上下文中表示不同的事件类型。（because the same event might appear in the form of various trigger expressions and an expression might represent different event types in different contexts.）
层次网络结构，得到更加的语义表示，用来做trigger word的分类问题。
在语义表示上，一种混合神经网络作品，它结合了双向 LSTM (Bi LSTM) 和卷积神经网络来学习句子中每个单词的连续表示。（In this section, we introduce a hybrid neural networks, which combines Bi-directional LSTM (BiLSTM) and convolutional neural networks to learn a continuous representation for each word in a sentence）两个卷积层网络的C的大小分为：C2=2,C3=3.
最后的特征表示为：O = [F, B, C2, C3]

在这里插入图片描述