昇思训练营day16学习心得-LSTM+CRF序列标注

最新推荐文章于 2024-07-19 16:33:18 发布

沐礼607

最新推荐文章于 2024-07-19 16:33:18 发布

阅读量230

点赞数 8

文章标签： lstm 机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_66941876/article/details/140509404

版权

条件随机场(CRF)

序列标注：指的是给定输入序列，给序列中每个Token进行标注标签的过程。对序列进行标注，实际上是对序列中每个Token进行标签预测，可以直接视作简单的多分类问题。但是序列标注不仅仅需要对单个Token进行分类预测，同时相邻Token直接有关联关系。

而CRF是一种用于序列标注的判别式概率模型，它能够考虑整个序列的上下文信息，而不是仅仅对单个Token进行分类。CRF模型通过转移概率矩阵𝐏来建模相邻标签之间的依赖关系。

Score计算

根据CRF模型，计算给定输入序列和标签序列的得分。除了发射概率外，还需要考虑转移概率和序列开始或结束的额外概率。同时引入了一个掩码矩阵𝑚𝑎𝑠𝑘𝑚𝑎𝑠𝑘，将多个序列打包为一个Batch时填充的值忽略，使得ScoreScore计算仅包含有效的Token。

Normalizer计算

Normalizer是所有可能输出序列的Score的对数指数和（Log-Sum-Exp）

Viterbi算法

在完成前向训练部分后，使用Viterbi算法进行解码，与计算Normalizer类似，使用动态规划求解所有可能的预测序列得分。不同的是在解码时同时需要将第𝑖𝑖个Token对应的score取值最大的标签保存，供后续使用Viterbi算法求解最优预测序列使用。

CRF层

将Score计算、Normalizer计算和Viterbi算法整合为一个CRF层，作为神经网络模型的一部分。处理输入序列的Padding问题，确保CRF层仅对有效Token进行计算。

BiLSTM+CRF模型

设计一个双向LSTM+CRF的模型来进行命名实体识别任务的训练。

BiLSTM：捕获输入序列的前后文信息，提高特征提取能力。

CRF：利用CRF层建模标签之间的依赖关系，提高序列标注的准确性。

关注

8
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
昇思训练营day16学习心得-LSTM+CRF序列标注

不同的是在解码时同时需要将第𝑖𝑖个Token对应的score取值最大的标签保存，供后续使用Viterbi算法求解最优预测序列使用。根据CRF模型，计算给定输入序列和标签序列的得分。：指的是给定输入序列，给序列中每个Token进行标注标签的过程。对序列进行标注，实际上是对序列中每个Token进行标签预测，可以直接视作简单的多分类问题。而CRF是一种用于序列标注的判别式概率模型，它能够考虑整个序列的上下文信息，而不是仅仅对单个Token进行分类。：利用CRF层建模标签之间的依赖关系，提高序列标注的准确性。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。