A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy 论文总结

本文章主要针对论文A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy 阅读后自我的总结,主要从论文介绍、论文内容、论文总结三个方面进行展开,具体论文的原文可以查看底部的链接

 

  1. 论文介绍和动机

    本论文是发表在ACL2019的一篇paper,主要针对的领域为命名实体识别,由于某些命名实体的数据集(文中交代特别是医药领域)的label可以是多样的,文中举了一个例子如Figure 1,从图中可以看出分别有Tag-set1Tag-set2Tag-set3三种不同的label。针对这样的问题,传统的做法可能是分别先建立起层次结构(tag hierarchy),训练是分别可以通过单独训练(每种label单独训练各自模型的参数)或者联合训练(共享提取特征层,一般为bilstm等序列模型), 最后在测试集上预测时通过tag hierarchy来推理得到最后的命名实体。

                                                

    为了解决上述的问题,论文提出Tag Hierarchy Model,通过构建统一的Tag Hierarchy。即将所有label统一为一种,这样训练时就不需要考虑单独或者联合训练,只需要训练一种命名实体模型就可以,构建内容如Figure 4 所示,在下一节的论文内容中会详细讲解

                                       

 

2. 论文内容

    本节主要讲解作者在证明其方法的时候所做各种实验的部分细节,其实为了证明其方法的优越性,本文分别介绍了单独训练(Indep Independent Model)和联合训练(MTL Multitasking for heterogeneous)的训练方式,并在最后对比了各种模型的指标,下面首先介绍一下IndepMTL模型

    2.1 Independent Model

    其实Independent Model就是将Figure 1中不同的训练集分别构建单独的NER模型,模型框架如Figure 2所示。最后在组合预测阶段,首先将不同模型预测的label映射到测试集的标签上,然后将不同模型的预测结果统一到一起,文中分别用了三种方式进行统一(这里就不过多介绍了)

                                                   

2.2 Multitasking for heterogeneous

    MTL的模型如Figure 3所示,可以看到不同的label共享了输入层和特征提取层(biRNN),但是没共享tagging layer(这也是本文创新点需要解决的事),预测阶段和Independent Model在最后统一时做的一样。

                                  ​​​​​​​

2.3 Tag Hierarchy Model

    最后介绍下本文的创新点,本文创新点主要在与构建了一种(Tag Hierarchy)(1)将不同数据集的的label在预处理阶段统一了格式,而不需要像之前model一样需要在后处理阶段进行推理;(2)训练时只要训练一个如Figure 2一个单独的命名实体模型即可,即共享所有输入层、特征提取层和tag layer。其中Tag Hierarchy如下图所示: 

                                          

   其中在构建训练集label是分别从底往上寻找最外面的联合节点(这里联合是指几个数据集相同的根结点)作为label

3. 论文总结

    其实本文在模型上并没有什么创新的地方,主要在预处理阶段组合label时应用了(Tag Hierarchy),共享所有参数且不需要进行后处理,论文创新主要在构建label的巧妙(语义相关性)。

 

 

论文原文:https://www.aclweb.org/anthology/P19-1014.pdf

本文讲解的pdf可以在我的github上查看:https://github.com/GrinAndBear/NLP-Paper-Share/tree/master/NER

看完麻烦大家点个赞或者github上star一下多谢啦

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值