论文:Crowdsourcing Learning as Domain Adaptation: A Case Study on Named Entity Recognition

Crowdsourcing Learning as Domain Adaptation: A Case Study on Named Entity Recognition

众包形成的NER数据集可以看做领域适用问题,每个标注者视为一个领域,问题转为了多个领域的适应问题。

  • 看法:论文的想法比较新,可以将众包和domain adaptation问题结合起来。
    但又一点,和实际关联不大,不可能每条句子都有很多人来标注,文章在Conll03数据集上做测试时,是大约47个人标注一个句子。

前言

在众包学习模型中,减少众包中的噪声问题的方式:(1)majority voting
(2)减小众包数据和gold standard annotation(一般指专家标注的数据集)之间的距离。

文章思路

我们将每个注释器具体视为一个域,然后众包学习本质上几乎是一个多源域适应问题(We treat each annotator as one domain specifically, and then crowdsourcing learning is essentially almost a multi-source domain adaptation problem.)。
设定情景两种:一是有监督下的众包学习-领域适应问题(存在expert annotation的情况下);二是无监督下的众包学习(无expert annotation的情况下)

文章模型

PGN是每个domain adaptor产生的参数。

Parameter Generation Network (PGN) (Platanios et al., 2018; Jiaet al., 2019) to produce adapter parameters dynamically by input annotators.

adapater是可学习的参数
transformer参数固定了
在这里插入图片描述

模型部分

- Word Representation——Adapter◦BERT (Houlsby et al., 2019), where two extra adapter modules are inside each transformer layer.
x = w1 · · · wn在这里插入图片描述
Annotator Switcher
关键思想是使用参数生成网络 (PGN) (Platanios et al., 2018; Jia et al., 2019) 通过输入注释器动态生成适配器参数。PGN 模块将根据注释器输入动态为适配器生成 V ◦ 在这里插入图片描述在这里插入图片描述
在得到x之后,通过BiLSTM进一步编码。
之后是通过CRF得到label表示。

专家表示 e ( e x p e r t ) e^{(expert)} e(expert)

(1)有监督条件下,直接使用模型学习得到.
(2)无监督条件下,利用每个annotator的embedding的中心点估计得到。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YingJingh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值