论文阅读笔记 Named Entity Recognition for Novel Types by Transfer Learning

本文提出TransInit方法,通过迁移学习解决命名实体识别(NER)中领域和标签不匹配问题。首先在大规模源数据上训练CRF模型,然后学习源与目标NE类型的相关性,最后用神经网络微调目标NE类型的CRF。实验证明,即使只有少量目标领域训练数据,该方法也能显著提高NER性能。
摘要由CSDN通过智能技术生成

论文地址:https://aclweb.org/anthology/D16-1087  ,发表在了 EMNLP

摘要:

在本文中,我们提出了一种方法,在给定相关领域中具有相似(但不完全相同)的命名实体(NE)类型和少量域内训练数据的训练数据的情况下,我们使用迁移学习来学习特定域的NE模型。
本文新颖之处在于不仅假设域不匹配,而且还假设标签不匹配。

1、介绍

如果我们只有有限的训练数据,我们将无法可靠地学习特征参数。其次,源域中缺少目标NE类型使得迁移变得困难,因为我们不能直接将通过源域训练的模型应用于目标域。 Alvarado等(2015)表明即使NE标签集在各个域中相同,标签分布的大差异也会导致差的表现。尽管存在这些困难,但是可以在域之间传递知识,因为相关的NE类型通常共享词汇和上下文特征。

我们首先在大型源域训练语料库中训练NER模型,然后学习源和目标NE类型之间的相关性。在最后一步中,我们重用第二步的模型参数来初始化线性链CRF并对其进行微调以学习特定于域的模式。我们表明,基于仅125个目标域训练句子,我们的方法在强基线上的F分数提高了160%。

2、相关工作

主要介绍了kim(2015)的工作,此外处理缺乏注释的NER数据的另一种方法是利用远程监督,利用知识库来识别实体的提及。

3、NER中的迁移学习

我们提出的方法TransInit包括三个步骤:

(1)在大规模源数据域上训练一个线性链CRF。

(2)使用双层神经网络学习源NE类型和目标NE类型之间的相关性; 

(3)我们利用神经网络训练目标NE类型的CRF。

线性CRF的形式:

是只依赖于x的特征函数;

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值