《Chinese NER Using Lattice LSTM》2018年ACL论文
作用和动机
作用:用于中文的实体抽取
动机:避免分词不同带来的实体命名错误 和 以字为输入带来的词语内字之间的信息损失。
分词不同带来的实体命名不同的例子:
南京市长江大桥
南京市//长江大桥
南京//市长//江大桥
南京市//长江//大桥
模型
“以字输入的LSTM” 上整合 “以词输入的LSTM”
普通的LSTM,字输入的LSTM采用的方式就是这个
word LSTM
实际上也是一个LSTM,只不过没有输出门。
这样子引入问题:character cell LSTM有多个输入,怎么来求?
这部分相当于softmax。α是权重。α怎么求?
其中
训练
**目的:**最大化如下公式
损失函数
超参设置