论文题目:A Neural Layered Model for Nested Named Entity Recognition
论文出处:NAACL 2018
论文地址:https://www.aclweb.org/anthology/N18-1131
论文概要
相比于传统的单层级的NER任务(flat NER),在实际业务中会出现实体嵌套的情况,对应为嵌套NER任务(nested NER)。
下图是一个嵌套实体的实例:
这篇论文给出了一种可以实现嵌套实体识别的end to end 的解决方案。
模型pipeline
首先直接附上模型结构图:
模型结构很清晰,自底向上,从细粒度实体识别到粗粒度实体识别。每一层级的NER模型都是经典的bilstm+CRF。
这里简要记录下具体实现的几个细节:
- word representation
基于lstm提取字符表示后与词向量进行级联,得到最终的单词表示。
2.layerd NER
具体堆叠NER的实现细节,对于底层NER层识别出的实体,对实体内的特征向量求平均后作为下一层NER的输入,也就是将上一层识别出的实体作为一个token,一个整体来看待。如果上一层没有识别出实体(也就是‘O’标签),则直接将其特征向量输出作为下一层的输入。
对最底层来讲,特征向量就是上文提到的级联后的word representation,对后面的NER来说,特征向量是上一层LSTM的输出,如模型结构图所示。
实验结果
评测数据集:
实验结果:
这里不详细记录了,详见论文。
论文总结
- 论文提供了进行嵌套NER识别的端到端的解决方案。
- 论文针对的是从inside 到 outside的识别方案,即先识别细粒度实体,再识别粗粒度实体。