文献阅读05期:GLaRA - 弱监督实体识别的图方法扩充

GLaRA是一种基于图的弱监督命名实体识别(NER)框架,通过从未标注数据中自动学习和扩充标注规则,提高了NER模型的性能。通过构建包含候选规则的图并应用图神经网络,GLaRA能够发现新的标注规则,从而生成弱标签进行训练。在三个NER数据集上的实验表明,GLaRA平均提升了20%的评分。
摘要由CSDN通过智能技术生成

在这里插入图片描述
[ 文献阅读·DL ] GLaRAc: Graph-based Labeling Rule Augmentation forWeakly Supervised Named Entity Recognition

推荐理由:本文收录于EACL2021,文章提出了一种基于图的标注规则增强框架,该框架可以从未标注的数据中自动学习新的标注规则。

原文标题:GLaRA: Graph-based Labeling Rule Augmentation forWeakly Supervised Named Entity Recognition[1]

1.摘要&简介

  • 人工标记是一件昂贵且费力不讨好的事情,所以Named Entity Recognition(NER,命名实体识别)系统应运而生。
  • 不过当下NER算法也面临很多挑战,首先大部分NER算法都需要大量的人工加工,并且还要相关领域的专业知识作支撑。
  • GLaRA是一套规则扩充框架,可以从未标记的数据中学习心得标记规则。
  • 近年来,通过启发规则创建弱标签的方法逐渐流行,其也被称作为“标记规则”,虽然这套规则不要求人工标记,但为特定领域写“标记规则”也是个很麻烦的事情。
  • 它需要规则制定者对所要研究并标记的领域有深刻的见解才行。
  • 由此,本文提出GLaRA
  • 第一步:本文的做法首先创建一个图,图中节点代表着从未标记数据中所抽取出来的候选规则。
  • 第二步:通过搜索规则之间语义上的关系,设计一个新的图神经网络用来扩充标记规则。
  • 最终步:将扩充之后的规则应用到未标记的数据上,并产生弱标签。用这些弱标签训练一个NER模型。
  • 本文通过三个NER数据集评估GLaRAc的效果,平均评分提高20%
  • 我们可以根据已有的规则以及语义关系来发现潜在的新的规则。
  • 下图展示了GLaRA的基本流程:
    在这里插入图片描述

2.GLaRA本体

  • 大段文字描述就略过了,配合图2,看一眼大致知道其行文逻辑,以下仅对关键的图传播模型(Graph Propagation Model)进行拆解:
  • 语义相近的规则在预测实体标签的时候,结果也应当较为相似。
  • 对于节点 i i i,令给定输入Embedding为 h i h_i hi,且其近邻为 N i \mathcal{N}_{i} Ni,首先计算连接对 ( i , j ) (i,j) (i,j)的注意力权重,公式如下:
    α i j = exp ⁡ ( f ( A T [ W h i , W h j ] ) ) ) ∑ k ∈ N i exp ⁡ ( f ( A T [ W h i , W h k ] ) ) (1) \alpha_{i j}=\frac{\left.\exp \left(f\left(A^{T}\left[W h_{i}, W h_{j}\right]\right)\right)\right)}{\sum_{k \in N_{i}} \exp \left(f\left(A^{T}\left[W h_{i}, W h_{k}\right]\right)\right)}\tag{1} αij=
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值