CRF Layer on the top of BiLSTM-2_trans

最新推荐文章于 2021-04-13 18:13:47 发布

rebirth_2020

最新推荐文章于 2021-04-13 18:13:47 发布

阅读量178

点赞数

分类专栏：训练

原文链接：https://createmomo.github.io/2017/09/23/CRF_Layer_on_the_Top_of_BiLSTM_2/

版权

训练专栏收录该内容

13 篇文章 0 订阅

订阅专栏

https://createmomo.github.io/2017/09/23/CRF_Layer_on_the_Top_of_BiLSTM_2/### ### 回顾:
CRF层可以对训练集进行训练，得到一个最终的概率最高的标签序列。

CRF layer

在CRF lyaer的loss函数中，有两种score。一种是发射（emission）score，一直是转移（transition）score。
其中发射概率是由BiLSTM得到的，如下图所示
在这里插入图片描述
transition score， tyiyjco用来代表转移分值。例如t(B-Person,I-Person)代表从B-Person标签跳转到I-Persion的概率为0.9.
代码中应该是crf_log_likelihood吧？代码中的emmision scroe体现在哪呢？
-除了定义的标签外，再添加一个START和END。这张表就是转移矩阵，代表了每个标签互相转移的概率。
在这里插入图片描述

由图可以看出第一个单词应该是B-或者O而不能I-。
B-Orga 和I-Orga配对，而和I-Person配对的可能性大大降低。
O后接I-label的可能性很小。
这个矩阵是BiLSTM-CRF模型的参数。在训练模型前，需要随机初始化这个转移矩阵。在训练过程中，这写矩阵中的值会进行更新。这个矩阵会学习到标签之间互相跳转的可能性。这个矩阵不需要手动构建，而会随着训练迭代的增加而有一个显著的优化。

下一步将会介绍:

CRF的loss函数，包含了真正的标签序列分值以及所有可能的序列的分值。【疑问，所有序列的分值总数不是1吗？】

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CRF Layer on the top of BiLSTM-2_trans

https://createmomo.github.io/2017/09/23/CRF_Layer_on_the_Top_of_BiLSTM_2/### ### 回顾:CRF层可以对训练集进行训练，得到一个最终的概率最高的标签序列。CRF layer在CRF lyaer的loss函数中，有两种score。一种是发射（emission）score，一直是转移（transition）score。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。