CRF Layer on the top of BiLSTM-3_trans

最新推荐文章于 2020-02-25 23:10:21 发布

rebirth_2020

最新推荐文章于 2020-02-25 23:10:21 发布

阅读量147

点赞数

分类专栏：训练

原文链接：https://createmomo.github.io/2017/10/08/CRF-Layer-on-the-Top-of-BiLSTM-3/

版权

训练专栏收录该内容

13 篇文章 0 订阅

订阅专栏

https://createmomo.github.io/2017/10/08/CRF-Layer-on-the-Top-of-BiLSTM-3/
CRFloss由真实标签序列分数和所有可能标签序列的分值组成。真实标签序列的分数在所有可能的标签序列中，应当是得分最高的一个。
如下图所示，假设一个句子由5个单词组成，这个句子的所有标签序列的可能结果有N个，第i个标签序列的分值为p(i)。

在这里插入图片描述
那么总分值如下（这个公式在徐义达的HMM课程中有讲）:

假定第10个标签序列是真实的标签序列，该标签序列是由我们的训练集提供的（好像由负采样的影子啊）
CRF的loss函数如下:训练的目标是提高P(realpath)的比重。
在这里插入图片描述
那么问题来了:

如何定义一个序列标签的分数呢，即S(i)
怎么样计算P(total)。从上面公式中可以看出，是求了e的S(i)次幂.
当计算出P(total)时，我们需要列出所有的可能的标签序列嘛？并不需要

next

如何计算一个句子的真实标签序列的分值。
如何计算一个句子所有可能的标签序列的分值的综合。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CRF Layer on the top of BiLSTM-3_trans

https://createmomo.github.io/2017/10/08/CRF-Layer-on-the-Top-of-BiLSTM-3/CRFloss由真实标签序列分数和所有可能标签序列的分值组成。真实标签序列的分数在所有可能的标签序列中，应当是得分最高的一个。如下图所示，假设一个句子由5个单词组成，这个句子的所有标签序列的可能结果有N个，第i个标签序列的分值为p(i)。那么总分...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。