用于嵌套命名实体识别的多层神经网络模型[NAACL 2018]阅读笔记

论文题目:A Neural Layered Model for Nested Named Entity Recognition
论文出处:NAACL 2018
论文地址:https://www.aclweb.org/anthology/N18-1131

论文概要

相比于传统的单层级的NER任务(flat NER),在实际业务中会出现实体嵌套的情况,对应为嵌套NER任务(nested NER)。
下图是一个嵌套实体的实例:
在这里插入图片描述
这篇论文给出了一种可以实现嵌套实体识别的end to end 的解决方案。

模型pipeline

首先直接附上模型结构图:
在这里插入图片描述
模型结构很清晰,自底向上,从细粒度实体识别到粗粒度实体识别。每一层级的NER模型都是经典的bilstm+CRF。

这里简要记录下具体实现的几个细节:

  1. word representation
    在这里插入图片描述
    基于lstm提取字符表示后与词向量进行级联,得到最终的单词表示。

2.layerd NER
在这里插入图片描述
具体堆叠NER的实现细节,对于底层NER层识别出的实体,对实体内的特征向量求平均后作为下一层NER的输入,也就是将上一层识别出的实体作为一个token,一个整体来看待。如果上一层没有识别出实体(也就是‘O’标签),则直接将其特征向量输出作为下一层的输入。
对最底层来讲,特征向量就是上文提到的级联后的word representation,对后面的NER来说,特征向量是上一层LSTM的输出,如模型结构图所示。

实验结果

评测数据集:
在这里插入图片描述
实验结果:
这里不详细记录了,详见论文。

论文总结

  1. 论文提供了进行嵌套NER识别的端到端的解决方案。
  2. 论文针对的是从inside 到 outside的识别方案,即先识别细粒度实体,再识别粗粒度实体。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值