Bidirectional LSTM-CRF Models for Sequence Tagging
原论文下载地址:https://arxiv.org/pdf/1508.01991v1
论文摘要
本文百度出品。使用双向LSTM+CRFs 模型用于NLP序列标注问题(POS、分块、命名实体识别)。作者认为应该是这个模型首次用于该研究领域。模型两个优点,精度高和对词向量的依赖性小 (In addition, it is robust and has less dependence on word embedding as compared to previous observations)
研究背景
序列标注是基础性的NLP研究课题,是许多NLP任务的基础。比如搜索引擎使用命名实体识别查询语句中的产品类实体,继而推荐广告。经典的序列标注有HMM、MEMMs和CRFs(Lafferty et al., 2001)三种,其中CRFs的效果最好,可以解决HMM和MEMMs的标签偏置(label bias)问题。后来词向量的研究兴起,Collobert(Collobert et al.201) 的C&W词向量也在序列标注一展身手。Collobert 用的是卷积神经网络+CRF。LSTM在语音识别等领域已经有了成功的应用,引文若干。作者在之后的实验中对比了这些模型和自己模型(BI-LSTM-CRF, state of the art)的结果。
模型介绍
LSTM
可以参考一下博客,如果浏览器加载不出图片,请换一个Chrome或者Edge浏览器
http://blog.csdn.net/Dark_Scope/article/details/47056361
双向LSTM
http://blog.csdn.net/jojozhangju/article/details/51982254
A. Graves and J. Schmidhuber. 2005. FramewisePhonemeClassificationwithBidirectional LSTM and Other Neural Network Architectures. Neural Networks