​复旦大学邱锡鹏组:CNN-NER——极其简单有效的嵌套命名实体识别方法

ea550cff610c579516b898300e1e5577.gif

©PaperWeekly 原创 · 作者 | 陆星宇

单位 | 复旦大学

研究方向 | 自然语言处理

本文介绍一下复旦大学 NLP 组的一篇新的 NER 论文。

b0988c2cc6ef2eb09a8c4bdec56640aa.png

论文标题:

An Embarrassingly Easy but Strong Baseline for Nested Named Entity Recognition

论文链接:

https://arxiv.org/abs/2208.04534

0a965c7751fa7294295dd18e489f00c6.png

问题简介

命名实体识别(NER)是自然语言处理的一个基本任务,该问题考虑的识别并分类给定文本中表达对实体的引用的文本片段(span),也就是所谓的命名实体(NE)。

过去的命名实体识别主要考虑的是扁平命名实体识别(flat NER)。近年来有一些工作考虑了实体之间可能存在嵌套关系,由此对应地提出嵌套命名实体识别(nested NER)这一新任务,并尝试给出了一些解决方案。

具体来说,如下图(1)所示:“上海市红十字会”就是一个典型的包含嵌套命名实体的例子。其中“上海市”是地名、“红十字会”是组织名、“上海市红十字会”是组织名且嵌套了上述两个命名实体。

299b3c860b9dce68ae382fb28280cde2.png

▲ 图(1) 嵌套命名实体示例

在嵌套命名实体识别任务中,虽然允许外层的命名实体嵌套内层的命名实体,但是并不允许命名实体之间的冲突(clash)。形象地说,就是不允许两个不同的命名实体之间首尾相交。

形式化地:

给定包含 个词的输入序列 ,嵌套命名实体识别任务旨在从输入序列 中提取出所有互不冲突的命名实体。其中每一个命名实体 可以被表示为三元组 , 和 分别表示其在序列

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值