一、背景
SVM(2010),MV-RNN(2012),CNN(2014),FCM(2014),CR-CNN(2015),DepNN(2015)。
理论上,RNN可以任意长度的序列进行建模。但由于梯度消失/梯度爆炸问题。实际上无法实现。LSTM引入门控机制,改进了RNN,从而获得了对长序列建模的能力。
本文提出了双向长短时记忆网络(BLSTM)来对包含所有单词完整、顺序信息的句子进行建模。同时,还使用从词汇资源(如WordNet)或NLP系统(如依赖解析器和命名实体识别器(NER)中获取的特征。在SemEval-2010上的实验结果表明,仅将单词嵌入作为输入特征的基于BLSTM的方法就可以达到最先进的性能,引入更多的特征可以进一步提高性能。
F:Forward
B:Backward
h:hidden
c:cell
二、模型
1.Initial Feature Extraction(初始特征提取)
word features
position features
POS features
NER features
hypernyms(WNSYN) features
DEP features
Relativ