论文笔记|Bidirectional LSTM-CRF Models for Sequence Tagging

最新推荐文章于 2023-06-18 06:00:00 发布

期待成功

最新推荐文章于 2023-06-18 06:00:00 发布

阅读量778

点赞数 1

分类专栏：笔记文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011150266/article/details/117590066

版权

本文介绍了百度研究院2015年的经典论文，探讨了LSTM、CRF及其组合在序列标注任务（如词性标注、命名实体识别）中的应用。论文提出BiLSTM-CRF模型，通过结合LSTM的长期依赖捕捉和CRF的全局序列信息，提升了序列标注的准确性，并在多个数据集上进行了实验验证。

摘要由CSDN通过智能技术生成

前言
这篇论文是关于NER的一片经典论文，由百度研究院2015年发表。论文来源

前两篇论文笔记与其说是笔记，更多地却像是在做翻译，最近才开始系统接触NER，便选择了较经典的一篇，基础向。

文章目录

- 摘要
- 正文
- - LSTM
  - CRF
  - LSTM-CRF
  - BiLSTM-CRF
- 实验
- - 数据集
  - 特征
  - 结果
- 总结

摘要

该论文提出了几种基于LSTM的序列标注模型：LSTM，BiLSTM，LSTM-CRF，BiLSTM-CRF。该工作首次将BiLSTM-CRF应用于NLP基准序列标注数据集。

正文

序列标注包括词性标注(POS)、词义组块(chunk)和命名实体识别(NER)，是一个经典型的自然语言处理任务。
　　传统的命名实体识别就是一种序列标注任务，每个字符输入对应一个标注，如下面这个例子就包含三个实体
在这里插入图片描述
整句则可以被标注为

其中，
PER：即person，人物
ORG：即organization，组织
LOC：即location，地点
MISC：即miscellaneous，杂项
B，I，E，O分别指示开始，中间，结束，其他

LSTM

由上面可以看到，每个输入字符对应一个标记输出，所以用普通的RNN就可以进行该任务，如图
在这里插入图片描述
同理LSTM，更善于捕获长期依赖

这里复习下LSTM，LSTM单元的内部结构如下，这里的是未展开的形式

对应的公式

可以看到图上有四个输入 $x_t$ ，其中一个产生新的候选值，三个输入对应三个门， $i_t,o_t,f_t$ 分别对应输入门，输出门，遗忘门。
　　 $c_t$ 代表长期记忆，也是新的候选值。例如，由公式可知若

最低0.47元/天解锁文章

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。