CRF Layer on the top of BiLSTM-5_trans

https://createmomo.github.io/2017/11/11/CRF-Layer-on-the-Top-of-BiLSTM-5/
在4中解释了如何计算S(i),在这节中说明如何计算P(total)
P(total)可以直接求解,但是效率非常低。
在这里插入图片描述
根据之前的loss定义,我们加上一个log,会变成了负数,再加上一个负号,求当前loss的最小值了。【和P(real)/P(total)成反比,即求当前loss的最小化,即为求P(real)/P(total)得最大化】
如下公式得最后一行,应该是分别为发射概率矩阵和转移概率矩阵,但是转移概率矩阵为什么是y(i),y(i+1)得关系呢?
在这里插入图片描述
那么,现在求P(total)的过程转换成了上面的公式,而转移矩阵和发射矩阵是可以直接算得的。那么重点就是求
在这里插入图片描述
接下来的步骤中,有两个重要的变量,obs和previous,其中obs表示当前单词的信息,previous存储了前面所有步骤的结果。
下一篇是要讲,当来了一个句子之后,如何通过模型预测出序列标签。那么…到目前为止,实际上是讲到了loss,并没有讲网络参数(forward)如何更新参数(optimizer),而这个内容在pytorch中有比较好的讲解。pytorch_learning pytorch with examples

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值