AAAI2023 | 百度+中科院提出USM：一种信息抽取的大一统方法

最新推荐文章于 2025-02-11 20:44:38 发布

zenRRan

最新推荐文章于 2025-02-11 20:44:38 发布

阅读量1.1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27590277/article/details/128859904

版权

文章提出USM方法，一种将各种信息抽取任务集成到统一模型的方案，旨在解决传统方法中任务特定的设计和昂贵的监督需求。USM通过结构化和概念化两个基本能力，使用统一的标记链接操作处理IE任务，展示出在监督和低资源环境中的优秀性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一句话总结

信息抽取任务具有多样的抽取目标和异构的结构，而传统的模型需要针对特定的任务进行任务设计和标签标注，这样非常的耗时耗力。本文提出一种USM方法，将各种信息抽取任务通过一种统一的模型方法完成。

点击这里进群—>加入NLP交流群

论文: Universal Information Extraction as Unified Semantic Matching
链接: https://arxiv.org/pdf/2301.03282.pdf
单位: 百度、中科院

USM

信息抽取（IE）的挑战在于标签模式的多样性和结构的异构性。

传统方法需要针对特定任务的模型设计，并且严重依赖昂贵的监督，因此很难推广到新模式。

在本文中，我们将 IE 分解为两种基本能力，「结构化」(Structuring)和「概念化」(Conceptualizing)，它们由不同的任务和模式共享。

基于这种范式，我们建议使用「统一语义匹配 (Unified Semantic Matching, USM)」 框架对各种 IE 任务进行通用建模，该框架引入了三个统一的标记链接操作来建模结构化和概念化的能力。

这样，USM 可以联合编码模式和输入文本，并行地统一提取子结构，并按需可控地解码目标结构。

本文的贡献为：

算法细节

实验分析

对 4 个 IE 任务的实证评估表明，所提出的方法在监督实验下实现了最先进的性能，并在零/少镜头传输设置中表现出强大的泛化能力。

USM在不同数据集上的结果

零样本迁移实验

少样本实验

总结

在本文中，我们提出了一个统一的语义匹配框架——USM，它对提取模式和输入文本进行联合编码，并行地统一提取子结构，并按需可控地解码目标结构。

实验结果表明，USM 在监督实验下实现了最先进的性能，并在零/少场景设置下表现出强大的泛化能力，验证了 USM 是一种新颖、可传输、可控和高效的框架。

对于未来的工作，我们希望将 USM 扩展到 NLU 任务，例如文本分类，并研究 IE 的更多间接监督信号，例如文本蕴含。

最近文章


深入理解Pytorch中的分布式训练


点击这里进群—>加入NLP交流群

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。