An Embarrassingly Easy but Strong Baseline for Nested Named Entity Recognition

最新推荐文章于 2024-08-16 18:13:47 发布

pepsi_w

最新推荐文章于 2024-08-16 18:13:47 发布

阅读量409

点赞数

分类专栏：论文文章标签： NER 人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangyumei0916/article/details/133944709

版权

论文专栏收录该内容

39 篇文章 3 订阅

订阅专栏

原文链接：

https://aclanthology.org/2023.acl-short.123.pdf

ACL 2023

介绍

问题

基于span来解决嵌套ner任务的范式，大多都是先对span进行枚举，然后对每个span进行分类，实际就是得到一个分数矩阵，矩阵中每个元素表示一个span（比如矩阵中的n行m列，对应着span（token_n, token_m））。作者认为这种方法忽略了span与sapn之间的空间信息。

IDEA

在矩阵中，每个span与其周围的span在原句中都是比较接近的，存在一定的空间语义信息。因此作者提出使用CNN来对span之间的空间信息进行建模。

方法

整体来说，首先对span进行枚举，然后通过Biaffine decoder得到一个三维的特征矩阵，在此基础上使用CNN来进行卷积，在span与span之间进行交互，丰富span的表征，最后对其进行分类。整体结构如下图所示：

Span-based Representation

使用一个预训练模型（比如BERT）来得到输入句子的word embedding，对于分词后的token，使用max-pooling来得到这个word的词嵌入：

然后使用一个多头的Biaffine decoder来得到每个span的分数矩阵R：

CNN on Feature Matrix

使用CNN来对span与其周围的span之间的交互进行建模，

这里由于句子中的token数量不同，导致分数矩阵R的大小会不同，为了进行批量计算，在矩阵中使用0来进行padding。

Output

使用一个mlp来得到相应的预测对数：

模型的损失函数是一个分类二值交叉熵：

实验

在ACE2004和ACE2005这两个数据集上进行实验，结果如下所示：

在genia数据集上进行了实验（预训练模型使用BioBERT-base），结果如下图所示：

为了研究为什么CNN有利于嵌套ner任务，作者将实体分为两类：嵌套实体（nest ner）和非嵌套实体（flat ner）。作者设计了 4 个指标 NEPR(flat entity precision)、NERE(flat entity recall)、FEPR(nested entity precision) 和 FERE(nested entity recall)：

结论

论文想法很简单，使用了卷积来对不同的span进行交互，使其能够学习到周围span的信息，但是其实从实验结果来看，加了CNN的效果并没有很大的提升。但将卷积利用到NER任务中，也浅算一个创新点吧，或许可以考虑不止在span与span之间进行卷积。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
An Embarrassingly Easy but Strong Baseline for Nested Named Entity Recognition

问题基于span来解决嵌套ner任务的范式，大多都是先对span进行枚举，然后对每个span进行分类，实际就是得到一个分数矩阵，矩阵中每个元素表示一个span（比如矩阵中的n行m列，对应着span（token_n, token_m））。作者认为这种方法忽略了span与sapn之间的空间信息。IDEA在矩阵中，每个span与其周围的span在原句中都是比较接近的，存在一定的空间语义信息。因此作者提出使用CNN来对span之间的空间信息进行建模。
复制链接

扫一扫

专栏目录

pepsi_w CSDN认证博客专家 CSDN认证企业博客

码龄5年

164: 原创

29万+: 周排名

1万+: 总排名

8万+: 访问

: 等级

1791: 积分

831: 粉丝

154: 获赞

23: 评论

270: 收藏

私信

关注

热门文章

分类专栏

最新评论

A Span-based Multi-Modal Attention Network for joint entity-relationextraction
十九岁的花季少女: 您好，请问您有这个源码吗，我没有找到，如果有的话可不可以麻烦您发我邮箱一份：1348874416@qq.com。万分感谢
PIQN：Parallel Instance Query Network for Named Entity Recognition
pepsi_w: 这篇论文没有复现过不知道具体情况但是看文件名应该是你需要下载wordvec和预训练模型放在对应的文件夹里面 readme里面没有写吗？
PIQN：Parallel Instance Query Network for Named Entity Recognition
Platycodon_carol: 请问复现时，训练出现了问题。缺少了两个文件： 1.piqn 文件夹下的configs文件夹下的flat.conf文件里的wordvec_path路径的文件 2.piqn 文件夹下的configs文件夹下的flat.conf文件里的model_path路径的文件
Leetcode55&&LeetCode45
普通网友: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Leetcoed122
CSDN-Ada助手: 推荐算法技能树：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。