文章目录
1. BiLSTM-CRF命名实体识别概要
假设有一个数据集,其中有两个实体类型,Person和Organization。但是,事实上,在我们的数据集中,我们有5个实体标签
B-Person
I- Person
B-Organization
I-Organization
O
设x是一个包含5个单词的句子:w0,w1,w2,w3,w4
。在句子x中,[w0,w1]是一个Person实体,[w3]是一个Organization实体,其他都是“O”
1.1 模型介绍
BiLSTM-CRF模型总体结构图如图1所示
- 首先,将句子x中的每个单词表示为一个向量,其中包括单词的嵌入和字符的嵌入。字符嵌入是随机初始化的。词嵌入通常是从一个预先训练的词嵌入文件导入的。所有的嵌入将在训练过程中进行微调。
- 第二,BiLSTM-CRF模型