【论文笔记】Bidirectional LSTM-CRF Models for Sequence Tagging

Bidirectional LSTM-CRF Models for Sequence Tagging

论文作者:Zhiheng Huang、Wei Xu 、Kai Yu

单位:百度

论文地址

论文源代码

0 摘要

在本篇论文中作者提出了一系列基于LSTM(Long-Short-Term Memory)的模型用于序列标注任务。这些模型包括BI-LSTM,LSTM-CRF,BI-LSTM-CRF。因为具有双向LSTM组件,BI-LSTM-CRF模型可以有效的利用过去和将来的输入特征。因为具有CRF层,BI-LSTM-CRF模型可以句子级别的标签信息。

1 引言

简单介绍了序列标注(Sequence tagging)的概念。

现有的序列标注模型大都基于线性统计学模型,比如隐马尔可夫模型HMM、最大熵马尔可夫模型MEMMS和条件随机场CRF等。

2011年,出现了基于卷积神经网络的模型用于序列标注任务的工作。

2013年,Graves等人提出了双向的循环神经网络来解决语音识别的问题。

在这篇论文中,作者提出了一系列基于神经网络的模型用于序列标注任务。

作者贡献点

  • 系统地比较了上述模型在NLP标注数据集上的性能
  • 该工作是第一个第一个将BI-LSTM-CRF模型应用到NLP基准序列数据集上的。
  • 我们证明了BI-LSTM-CRF模型是具有鲁棒性的,它可以产生准确的标记性能,而无需借助单词嵌入。

2 模型

2.1 LSTM Networks

作者简要介绍了RNN网络。

RNN维持的记忆是基于历史信息,能够使模型通过长距离来预测当前输出。

下面是一个RNN模型用于序列标注的示意图:

在这里插入图片描述

但是RNN是有缺点的,RNN是想把所有的信息都记住,不管是有用的还是没用的。这会导致梯度消失的问题,即通过长距离的传递后,最前面的历史信息会被抹掉。

因此作者又引出了LSTM网络模型。

LSTM(Long Short-Term Memory networks )模型和RNN模型基本一致,区别在于LSTM将RNN的隐藏层更新单元换成了记忆细胞(memory cell)来选择性的记忆过去的信息。

在这里插入图片描述

在这里插入图片描述

2.2 Bidirectional LSTM Networks

在序列标注任务中,我们应用一个双向的LSTM模型(Graves et al., 2013)来利用过去的和未来的输入特征。对于一个给定的时间,我们应用前向过程去利用过去的输入特征,利用后向过程去利用未来的输入特征。

在这里插入图片描述

细节处理:在数据的开始节点和结束节点要特殊处理。另外可以批量进行提高效率。

2.3 CRF networks

在预测当前标签的任务中有两种利用邻居标签信息的方法。第一种方法(MEMMs)是先为每个时间步预测标签分布,然后用beam-like解码预测最合适的标签;第二种方法(CRF)聚焦在句子级别。CRF的输入输出是直接相连的,这点和LSTM和Bi-LSTM是不同的。

在这里插入图片描述

2.4 LSTM-CRF networks

作者结合一个LSTM网络和一个CRF网络形成了LSTM-CRF模型。

该模型可以高效地利用过去的输入特征(通过一个LSTM层)同时可以高效地利用句子级别的标签信息(通过一个CRF层)。

CRF层由连接连续输出层的线表示。CRF层以状态转移矩阵作为参数。

在这里插入图片描述

2.5 BI-LSTM-CRF networks

作者结合一个双向的LSTM和一个CRF网络形成了BI-LSTM-CRF模型。

此外,在LSTM-CRF模型中,过去的信息和句子级别的标注信息可以被利用;BI-LSTM-CRF可以利用未来的输入特征。

在这里插入图片描述

3 训练

算法

在这里插入图片描述

4 实验

数据

作者分别应用上述模型在PTB数据集进行POS tagging、在CoNLL2000进行chunking、在CoNLL2003进行 NER任务。

特征

作者在三个数据集上提取了三种相同的特征。

分别是拼写特征、上下文特征和单词嵌入。

实验结果

在和Baseline方法如LSTM、BI-LSTM和CRF比较中,作者提出的模型都取得了最佳性能。

在鲁棒性实验中,作者提出的模型仅仅利用word feature就可以取得不错的结果。

在这里插入图片描述

在这里插入图片描述

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值