- 1、先验知识: 命名实体识别或序列标注,基本掌握LSTM、CRF的基本概念。也可参考:
- 2、基本概念与假设:
- 假设我们的数据集中有两类实体——人名和地名,与之相对应在我们的训练数据集中,有五类标签:
B-Person, I- Person,B-Organization,I-Organization, O
- 假设句子x由五个字符w1,w2,w3,w4,w5组成,其中【w1,w2】为人名类实体,【w3】为地名类实体,其他字符标签为“O”。
- 3、BiLSTM-CRF模型:
- BiLSTM-CRF模型结构
1、输入句子x通过字嵌入或词嵌入构成向量。如果是字嵌入,则是随机初始化的(char2id);若是