论文浅尝 | Doc2EDAG：一种针对中文金融事件抽取的端到端文档级框架

最新推荐文章于 2024-08-21 09:16:36 发布

开放知识图谱

最新推荐文章于 2024-08-21 09:16:36 发布

阅读量2.2k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/102387224

版权

论文提出Doc2EDAG，一种针对中文金融事件抽取的端到端解决方案，能有效处理文档级事件抽取的挑战。模型通过预处理、信息融合、信息记忆和路径扩展四个阶段，生成基于实体的有向无环图，解决了事件论元分散和多事件实例问题。在ChFinAnn数据集上表现优秀。

摘要由CSDN通过智能技术生成

论文笔记整理：叶宏彬，浙江大学博士生，研究方向为知识图谱、自然语言处理。

640?wx_fmt=png

链接：https://arxiv.org/pdf/1904.07535.pdf

背景

大多数现有的事件提取（EE）方法仅提取句子范围内的事件参数。但是，此类句子级的EE方法难以处理来自新兴应用领域（例如金融，法律，健康等）的大量文档，其中事件论元分散在不同的句子中，甚至多个事件实例在同一文档中同时存在。为了应对这些挑战，本文提出了一种新颖的端到端解决方案 Doc2EDAG，该解决方案可以有效地生成基于实体的有向无环图，以实现文档级事件抽取。

动机

本文的附录部分展示了中文金融事件抽取的几个难点，并用之前的 DCFEE模型作了对比分析：1）在多事件任务下，尽管 DCFEE-O 可以正确地识别关键语句，但它无法决定此语句表示多少事件，DCFEE-M 会产生多个部分正确的事件，但是 DCFEE-M 的论元补全阶段是上下文无关的；2）对于不同的句子多次提及同一事件的环境下，DCFEE 模型的关键句子检测模块无法有效地区分重复的事件实例，造成抽取事件冗余；3࿰

最低0.47元/天解锁文章

开放知识图谱

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。