复杂命名实体识别
文章平均质量分 94
实际应用中存在部分复杂实体的识别问题。这里的复杂指的是存在不连续(discontinuous entity)的单实体以及多实体之间的嵌套(nested entities)和交叉(overlapping entities)关系。
-Sussurro-
这个人很懒,还没有添加简介
展开
-
《复杂命名实体识别》
命名实体识别相关原创 2022-03-11 16:22:01 · 1884 阅读 · 0 评论 -
《BoningKnife: Joint Entity Mention Detection and Typing for Nested NER via prior Boundary Knowledge》
虽然命名实体识别(NER)是自然语言处理中的一个关键任务,但大多数方法只针对扁平实体,忽略了许多场景中常见的嵌套结构。现有的大多数嵌套NER方法遍历所有的子序列,既昂贵又低效,而且没有很好地考虑对嵌套实体很重要的边界知识。在本文中,我们提出了一个基于先验边界知识的实体检测和分类联合模型(BoningKnife),以更好地处理嵌套NER提取和识别任务。BoningKnife由两个模块组成,MentionTagger和TypeClassifier。翻译 2022-03-11 15:37:16 · 288 阅读 · 0 评论 -
《A Boundary-aware Neural Model for Nested Named Entity Recognition》
在自然语言处理中,实体中包含其他实体是一种常见情况。现有的大多数关于命名实体识别的工作只处理扁平实体,而忽略了嵌套实体。本文提出了一种边界感知的嵌套NER神经网络模型,它利用实体的边界来预测实体类别标签。模型通过使用序列标记模型来检测边界以精确定位实体。该模型在检测到的边界的基础上,利用边界相关区域预测实体类别标签,降低了分层序列标记模型的计算成本,缓解了误差传播问题。同时引入多任务学习来捕获实体边界及其类别标签的依赖关系,这有助于提高实体识别的性能。在嵌套NER数据集上的实验表明该模型优于其他最先进方法。翻译 2022-02-24 11:21:02 · 1046 阅读 · 0 评论 -
《A Neural Layered Model for Nested Named Entity Recognition》
大多数命名实体识别(NER)系统只处理扁平实体,而忽略了内部的嵌套实体,这将导致系统无法捕获底层文本中的细粒度语义信息。为了解决这一问题,我们提出了一种新颖的神经网络模型,它通过动态叠加扁平NER层来识别嵌套实体。其中每个扁平NER层都基于目前最先进的扁平NER模型,即使用双向长短期记忆(LSTM)网络来捕获序列上下文表示,并将其提供给级联的CRF层。翻译 2022-02-28 10:11:55 · 836 阅读 · 0 评论 -
《Deep Exhaustive Model for Nested Named Entity Recognition》
我们提出了一种深层神经模型用于嵌套命名实体识别。大多数NER模型只关注扁平实体而忽略了嵌套实体,不能充分捕捉文本中的潜在语义信息。我们模型的关键思想是枚举潜在实体的所有可能区域或跨度,并用深度神经网络对它们进行分类。为了降低计算成本和捕获区域周围的上下文信息,该模型使用共享的底层双向长短期记忆网络的输出来对区域进行表示。我们在生物医学领域的GENIA和JNLPBA语料库上评估了模型,结果表明在没有任何外部知识资源的情况下,模型在嵌套和扁平NER上的F值分别达到了77.1%和78.4%,优于目前最先进模型。翻译 2022-02-25 15:13:18 · 985 阅读 · 0 评论 -
《Joint Mention Extraction and Classification with Mention Hypergraphs》
我们为Mention的抽取分类联合任务提出了一种新颖模型。与现有的方法不同,我们的模型能够有效捕捉长度不限的重叠Mention。该模型具有高度可扩展性,其时间复杂度与输入句子中的单词数量和可能的Mention类别呈线性关系。我们的模型可以扩展到在相同的时间复杂度下,以联合的方式显式地额外捕获Mention头部。我们通过在标准数据集上的大量实验证明了模型的有效性。翻译 2021-12-31 22:04:55 · 563 阅读 · 0 评论 -
《Neural Architectures for Nested NER through Linearization》
我们提出了两种用于嵌套命名实体识别(NER)的神经网络架构,在该架构的设置中命名实体可以重叠,也可以被多个标签标记。我们使用线性化方案编码嵌套的标签。在我们提出的第一种方法中,嵌套标签被建模为多标签,对应于标准LSTM-CRF结构中嵌套标签的笛卡尔积。在第二种方法中,嵌套命名实体识别被看作是一个Seq2Seq问题,在这个问题中,输入序列由Tokens组成,输出序列由标签组成,并对正在预测标签的单词使用硬注意力(Hard Attention)。翻译 2022-01-03 19:24:02 · 632 阅读 · 0 评论