论文笔记:Few-Shot Named Entity Recognition: An Empirical Baseline Study

Few-Shot Named Entity Recognition: An Empirical Baseline Study

看法

整体感觉,这篇文章是工程实践中可以参考的,大杂烩的感觉,复现一次,应该就能吧self training,有监督学习的NER这两种范式,加上多模型的voting机制,应该就可以熟悉了。

现有的小样本学习的方法

(1)原型学习,利用每种类型的token表示,计算均值,作为每个原型type的representation
(2)在无标注数据上,做self training,一个teacher model(在有标注数据上做训练),一个student model(打上soft label)
(3)在无标注数据上,做model的PLM。

在这里插入图片描述

论文模型

(a)是最普通的,在有监督数据集上,做NER识别任务-------------------LC
(b)是利用原型网络,学习每个type的表示,利用最近邻原则,在test时,分配给token相应的tag---------------P
(c)是文章认为原始的PLM模型在大规模语料库学习时,采用的任务形式是mask token,这和NER任务并没有直接关系,它导致PLM视所有的token的地位等同,但在NER任务中,entity的地位应该高一些,所以,采用6.8G的维基细粒度实体数据集,重新训练了PLM模型,已达到entity的地位升高的效果----------------------NSP (noisy supervised pre-training)
(d)teacher-student model--------------------------------ST

![在这里插入图片描述](https://img-blog.csdnimg.cn/998d7715097f4bd99f7d019fefe63883.png #pic_center)

实验结果

Testing F1-score curves on 5-shot NER on CONLL-2003 dataset.

在这里插入图片描述

IO和BIO schema下的模型性能比较

![在这里插入图片描述](https://img-blog.csdnimg.cn/113956c6ec5142768bc17fbd8ded20a4.png #pic_center)

模型在新实体类型上的迁移能力

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YingJingh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值