A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy
论文背景:由于某些特别是医药领域中命名实体的数据集标签往往是多样的,例如下图,分别有Tag-set1、Tag-set2、Tag-set3三种不同的标签
针对这样的问题,传统的做法可能是分别先建立起层次结构(tag hierarchy),训练时要么单独训练每种标签各自模型的参数,要么联合训练即共享提取特征层(一般为BiLSTM等序列模型)
单独训练模型 | 联合训练模型 |
思路创新:该论文提出一个统一的Tag Hierarchy,称为Tag Hierarchy M