BilSTM 实体识别_BiLSTM-CRF

大纲:

  • 1.简介
    • 1.1 数据集
    • 1.2 BiLSTM-CRF模型
    • 1.3 如果我们没有CRF层怎么办?
    • 1.4 CRF层可以从训练数据中学习约束
  • 2. CRF层
    • 2.1 Emission score
    • 2.2 Transition score
    • 2.3 CRF 损失函数
    • 2.4 真实标签序列得分
      • 2.4.1 Emission Score
      • 2.4.2 Transition Score
    • 2.5 所有可能标签序列组合的总得分
    • 2.6 CRF的损失函数
      • 2.6.1 emission Score和transition Score

1. 简介

1.1 数据集

假设,我们有一个数据集,其中我们有两个实体类型,Person(人名)和Organization(组织名)。因此,事实上,在我们的数据集中,我们有5个实体标签:

  • B-Person
  • I-Person
  • B-Organization
  • I-Organization
  • O

此外,

是一个包含5个单词的句子,
。在句子
中,
是一个Person实体,
是Organization实体,其他是“O”。

1.2 BiLSTM-CRF模型

如下图所示:

5acaf6b66b380053a7bf2586d5fc0de0.png
图1.1:BiLSTM-CRF模型

虽然没有必要知道BiLSTM层的细节,但为了更容易理解CRF层,我们必须知道BiLSTM层输出的含义。

08925e78f51322fb62918aaded701d14.png
图1.2:BiLSTM层输出的含义

上图说明了BiLSTM层的输出是每个标签的分数。

例如,对于

,BiLSTM节点的输出为1.5(B-Person),0.9(I-Person),0.1(B-Organization),0.08(I-Organization)和0.05(O)。这些分数将是CRF层的输入。在CRF层中,将选择具有最高预测分数的标签序列作为最佳答案。

1.3 如果我们没有CRF层怎么办?

即使没有CRF层,我们也可以训练BiLSTM命名实体识别模型,如下图所示。

2a7e844a9f053d6304de315931324d0d.png
图1.3:没有CRF层输出正确标签的BiLSTM模型

因为每个单词的BiLSTM输出是标签分数。我们可以选择每个单词得分最高的标签。例如,对于

,“
B-Person”得分最高(1.5),因此我们可以选择“ B-Person”作为其最佳预测标签,
选择“
I-Person
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值