1.题目:
模型论文:Feature-Augmented Neural Networks for Patient Note De-identification
http://export.arxiv.org/pdf/1610.09704
工具论文:NeuroNER: an easy-to-use program for named-entity recognition based on neural networks
一个基于神经网络的简单易用的命名实体识别程序
2.论文地址:
https://www.aclweb.org/anthology/D17-2017/
Proceedings of the 2017 EMNLP System Demonstrations, pages 97–102
Copenhagen, Denmark, September 7–11, 2017.
3.单位:
MIT
4.代码:
https://github.com/Franck-Dernoncourt/NeuroNER
5.摘要:
提出了一个神经网络的NER工具;
NeuroNER更专注于可用性;
NeuroNER使用BRAT作为接口,即是它可以很好地兼容BRAT工具;
NeuroNER获得State-of-the-art;
另外它也把代码公开出来。
NeuroNER不支持BRAT格式的overlapping annotations的局限.
6.系统描述
NeuroNER包括两个主要部分:NER引擎&&与Brat的接口;加外还有实时训练监控,预训练模型等相关内容。
6.1 NER引擎
输入数据:训练集,验证集,测试集;
引擎网络包括3层:
字符增强token嵌入层:把每个token映射到向量;
Label预测层:把字符串表达构建成句子表达作为输入,输出为每个句子token的预测标注分布;
Label序列优化层:优化输出最有可能的标注序列;
模型使用了三种特征(token的嵌入,预测训练token, 人工特征工程)。
6.2 实时监控训练
Plots
TensorBoard
6.3 预训练模型
word2vec,GloVe
6.4 Annotations
7. 模型效果
8. 工具使用
训练与监控
预测与评估
布署
happyprince;https://blog.csdn.net/ld326/article/details/114261304