ACL 2021 | 复旦大学邱锡鹏组:面向不同NER子任务的统一生成框架

复旦大学邱锡鹏组提出了一种使用序列生成的统一框架,能处理flat NER、nested NER和discontinuous NER,通过BART模型实现,无需复杂标记,取得SOTA或接近SOTA的性能。
摘要由CSDN通过智能技术生成

©作者 | 刘兴贤

学校 | 北京邮电大学硕士生

研究方向 | 自然语言处理

论文题目:

A Unified Generative Framework for Various NER Subtasks

论文地址:

https://arxiv.org/abs/2106.01223

代码repo:

https://github.com/yhcc/BARTNER

该论文被收录于 ACL 2021 主会,作者是来自复旦大学的邱锡鹏老师组。

先插句题外话,本文的图示是我最近看过的文章里表意最明确的一篇,几乎只看图就能了解文章表达的意思。


Main Idea

图 abc 分别展示了 NER 的 flat NER(简单、扁平实体抽取)、nested NER(嵌套实体抽取)、discontinuous NER(不连续实体抽取)三种不同的子任务。

而对于这样复杂的子任务,无法使用传统的标记方法将其纳入同一个框架。因此,本文使用了指针方式,使用将标注任务转化为一个序列生成任务(本文的主要贡献也正在这里),并使用了 seq2seq 的范式来进行生成,生成过程使用了预训练模型 BART,这是一个利用从被破坏掉的文本中还原文本的任务作为预训练目标的模型。


Abstract

命名实体识别(NER)是识别代表句子中实体的跨度的任务。无论实体跨度

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值