论文浅尝 | 通过对比学习优化用于命名实体识别的双编码器

最新推荐文章于 2025-03-08 23:23:57 发布

开放知识图谱

最新推荐文章于 2025-03-08 23:23:57 发布

阅读量1k

点赞数 1

文章标签：学习深度学习机器学习自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/131058450

版权

本文介绍了一种将命名实体识别（NER）视为表示学习问题的方法，通过双编码器和动态阈值损失，在有监督和远程监督设置下取得SOTA结果。对比学习策略能有效区分实体与非实体，解决NER任务中的噪声和嵌套问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

笔记整理：陆星宇，东南大学硕士，研究方向为自然语言处理

链接：https://arxiv.org/abs/2208.14565

动机

命名实体识别（NER）是识别与命名实体相关的文本片段并将其分类到预定义的实体类型（如人物、位置等）的任务。作为信息提取系统中的基本组件，NER已被证明对各种下游任务如关系抽取、指代消解和细粒度观点挖掘有益。

以往的工作主要将NER作为序列标记或跨度分类来处理，存在许多局限性，例如难以用序列标注处理嵌套NER，基于跨度分类的学习和推理十分复杂，对监督数据中的噪声十分敏感。此外，现有的工作将所有非实体标记的跨度统一作为反例，当训练数据的标记不完整时，可能会引入假反例。

贡献

文章的主要贡献如下：

(1) 将NER视为一种表示学习问题，提出了一种用于命名实体识别的高效双编码器，并在通用和医疗领域的多个数据集上取得了SOTA结果。

(2) 引入了一种新的动态阈值损失，其学习针对候选实体的动态阈值以区分实体跨度和非实体跨度；

方法

1、模型结构

模型的总体架构如图1所示，实体类型编码器和文本编码器是同构且完全解耦的Transformer模型。在向量空间中，锚点（橙色标识）表示来自实体类型编码器的特殊标记[CLS]。通过对比学习，其最大化锚点与正标记（Jim）之间的相似性，并最小化锚点与负标记之间的相似性。虚线灰色圆圈（由锚点与文本编码器中的[CLS]之间的相似性限定）表示将实体标记与非实体标记分开的阈值。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。