CRF Layer on the top of BiLSTM-5_trans

rebirth_2020

于 2020-02-25 23:10:21 发布

阅读量167

点赞数

分类专栏：训练

原文链接：https://createmomo.github.io/2017/11/11/CRF-Layer-on-the-Top-of-BiLSTM-5/

版权

训练专栏收录该内容

13 篇文章 0 订阅

订阅专栏

https://createmomo.github.io/2017/11/11/CRF-Layer-on-the-Top-of-BiLSTM-5/
在4中解释了如何计算S(i)，在这节中说明如何计算P(total)
P(total)可以直接求解，但是效率非常低。
在这里插入图片描述
根据之前的loss定义，我们加上一个log，会变成了负数，再加上一个负号，求当前loss的最小值了。【和P(real)/P(total)成反比，即求当前loss的最小化，即为求P(real)/P(total)得最大化】
如下公式得最后一行，应该是分别为发射概率矩阵和转移概率矩阵，但是转移概率矩阵为什么是y(i),y(i+1)得关系呢？
在这里插入图片描述
那么，现在求P(total)的过程转换成了上面的公式，而转移矩阵和发射矩阵是可以直接算得的。那么重点就是求

接下来的步骤中，有两个重要的变量，obs和previous，其中obs表示当前单词的信息，previous存储了前面所有步骤的结果。
下一篇是要讲，当来了一个句子之后，如何通过模型预测出序列标签。那么…到目前为止，实际上是讲到了loss，并没有讲网络参数(forward)如何更新参数(optimizer)，而这个内容在pytorch中有比较好的讲解。pytorch_learning pytorch with examples

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CRF Layer on the top of BiLSTM-5_trans

https://createmomo.github.io/2017/11/11/CRF-Layer-on-the-Top-of-BiLSTM-5/在4中解释了如何计算S(i)，在这节中说明如何计算P(total)P(total)可以直接求解，但是效率非常低。根据之前的loss定义，我们加上一个log，会变成了负数，再加上一个负号，求当前loss的最小值了。【和P(real)/P(total...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。