《A Multi-task Approach for Named Entity Recognition in Social Media Data》
论文来源:ACL
论文时间:2017年9月
论文方向: 多任务学习,命名实体识别
论文链接:https://www.aclweb.org/anthology/papers/W/W17/W17-4419/
1. 摘要:
社交信息的缺点:固有的噪声信息;不当的语法结构;拼写不连续以及大量的缩写词
多任务框架: 使用命名实体分割的辅助任务和细粒度的命名实体分类的主要任务进行联合训练
优点:多任务学习能够从字词序列、语法信息和地名词典信息中学习到更高阶的特征。
神经网络在此作为一个特征 提取器,将提取到的特征传到CRF分类器中。
2. 引言:
联合训练多任务学习神经网络模型
CNN提取字粒度的信息: :提取字的形态信息和其他正交特征
BILSTM提取词粒度的信息: 上下文信息以及句法特征
地名词典应用:捕捉到比较常见的实体采用地名表的表示。
CRF: 神经网络提取的特征输入CRF进行分类。
CNN个LSTM是并行的,而不是将CNN的输出作为LSTM的输入
主要贡献: 使用多任务学习,并且结合了POS