上期我们介绍了2020年知识图谱最新权威综述论文《A Survey on Knowledge Graphs: Representation, Acquisition and Applications》的知识图谱补全部分,本期我们将一起学习这篇论文的实体发现部分。
论文地址:
https://arxiv.org/pdf/2002.00388.pdfarxiv.org
1 实体发现
本节将基于实体的知识获取区分为若干细分任务,即实体识别,实体消歧、实体类型和实体对齐。我们称它们为实体发现,因为它们都在不同的集合下探索实体相关的知识。
1.1 实体识别
实体识别或命名实体识别(NER)是一种在文本中标记实体的任务,当它关注于特定的命名实体时。手工制作的特征,如大写模式和特定语言资源,如地名录,在许多文献中都有应用。最近的工作利用squence-to-squence结构,例如,LSTM-CNN用于学习字符级和单词级特征以及编码部分词汇匹配。Lample等人通过叠加LSTM层和CRF层,即LSTM-CRF和Stack-LSTM。近年来,MGNER提出了一个集成框架,该框架具有不同粒度的实体位置检测和对嵌套和非重叠命名实体的基于注意力机制的实体分类。
1.2 实体分类
实体分类包括粗