命名实体识别(NER)知识汇总

最新推荐文章于 2025-03-09 10:36:55 发布

Mark_Aussie

最新推荐文章于 2025-03-09 10:36:55 发布

阅读量2.2k

点赞数 4

分类专栏： nlp 文章标签：自然语言处理

本文链接：https://blog.csdn.net/MarkAustralia/article/details/129492840

版权

nlp 专栏收录该内容

61 篇文章

订阅专栏

文章介绍了命名实体识别(NER)的基本概念，它作为NLP任务的基础，常常使用BIO等标注法。随着技术发展，从早期的HMM、CRF到深度学习的CNN、RNN，再到BERT模型与CRF的结合，NER方法不断进步。CRF在序列标注中起到关键作用，通过学习标签转移关系提高预测准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

介绍

命名实体识别（Named Entity Recognition，NER）是NLP领域中一项基础的信息抽取任务，NER 是关系抽取、知识图谱、问答系统等其他诸多NLP任务的基础。NER从给定的非结构化文本中识别命名实体，并对实体分类，如时间、人名、地名、机构名等类型的实体。

NER 常转化为序列标注问题，利用BIO、BIOES和BMES等常用的标注规则对经过分词的文本进行token标注。以BIO标注模式为例，下图为对文本进行token-level的命名实体标注实例，通过构建模型对文本的每个token标签进行预测，进行实体识别。

基于序列标注的命名实体识别

序列标注的命名实体识别方法中，CNN、RNN和BERT等深度模型与条件随机场CRF结合已经成为最主流和普遍的方法。

基于序列标注的命名实体识别的发展大致经历了以下三个历程：

[机器学习]：早期传统机器学习时代，除了利用人工规则的方法外，往往利用隐马尔科夫链HMM和条件随机场CRF进行实体标注；
[深度学习]：随着深度学习的发展，将CNN和RNN做为基本的文本特征编码器，更好的学习token或word的隐层表示，再利用CRF进行实体标签分类，Bi-LSTM-CRF是最常用和普遍的实体识别模型；
[预训练模型]：最近BERT为代表的预训练模型表现出了强大的文本表示和理解能力，目前最流行的方法是将BERT或BERT-Bi-LSTM作为底层的文本特征编码器，再利用CRF进行实体标签预测。现在，对于许多命名实体识别任务可以将BERT-Softmax、BERT-CRF、BERT-Bi-LSTM-CRF这几个模型作为baseline，而且能达到很好的效果，这几乎得益于BERT模型的强大文本表征建模能力。

CRF与NER

基于序列标注的命名实体识别方法利用CNN、RNN和BERT等模型对文本token序列进行编码表征，再利用全连接层对序列每个token分类，最后利用Softmax或CRF进行最终标签判断确定。

假设数据集的实体类别为 k个，以 BIO 作为标注模式，命名实体识别的过程如下：

假设数据的实体类别为 2：人名(P)和国家(C)， label_set = {B-C, I-C, B-P, I-P, O}。以“朝鲜领导人和普京举行会晤”句子为例，下图为命名实体识别的整个过程。

CRF实体标签判断

Softmax预测实体标签时是独立的，只由其对应token的输出所决定，同一序列中判断预测的多个标签也是独立的，没有关联和影响。而CRF是以标签路径为预测目标，可以在Logit基础上为最终的预测标签序列添加约束，确保预测的实体标签序列是有效的，约束可以由CRF层在训练过程中从训练数据集自动学习。

最终的输出可能会产生多种标签序列组合，如下图所示列举了三个标签路径组合，红色路径标签序列为 [B-C，I-C， ...,，B-P，I-P，...，O]，蓝色标签序列为 [O，B-P，...，I-P，O，..., O]，绿色标签序列为 [I-C，O，...，O，I-P，...，B-C]，红色路径为真实正确的，其他两条为可能预测产生的路径。