论文浅尝 - ACL2020 | 用于多媒体事件提取的跨媒体结构化公共空间

最新推荐文章于 2024-06-17 22:03:34 发布

开放知识图谱

最新推荐文章于 2024-06-17 22:03:34 发布

阅读量688

点赞数 1

文章标签： python 计算机视觉机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/112386131

版权

笔记整理 | 王琰，东南大学

来源：ACL 2020

链接：https://arxiv.org/pdf/2005.02472.pdf

概述

本论文引入一项新任务：多媒体事件提取（M²E²），该任务旨在从多模态中抽取出事件和其论点(M2E2)。此外，构造了第一个带注释的新闻数据集作为基准，以支持对跨媒体事件的深入分析。并且提出了一种新方法：弱对齐结构嵌入（WASE），该方法将语义信息的结构化表示形式从文本和视觉数据编码为共同的嵌入空间，通过采用弱监督的训练策略进行跨模态结构对齐，从而能够在无需显式跨媒体注释的情况下利用可用资源。

背景及动机

传统事件提取方法的目标是单一形式，例如文本、图像或视频。但是，当代新闻业是通过多媒体信息来传播新闻。从美国之音（VOA）中随机抽取的多媒体新闻文章进行分析，我们可以发现报道中33％的图像包含用作事件自变量的可视对象，但新闻文章中未提及它们。这说明了多媒体数据之间存在着的互补性和整体性的影响，因此作者提出了多媒体事件提取（M²E²），这是一项旨在从多种模式中联合提取事件和论点的新任务。

数据集

通过映射新闻领域（ACE2）的NLP社区中的事件本体和通用领域（imSitu）的CV社区中的事件本体，来定义具有多媒体新闻价值的事件类型。M²E²中的事件类型和论点角色统计结果如下表，其中包含8种ACE类型，映射到98种imSitu类型，通过添加来自imSitu的视觉论点来扩展ACE事件角色集。粗体显示扩展的事件类型和论点角色，括号中的数字表示文本和视觉事件/自变量的计数。

作者从美国之音（VOA）网站上收集了108,693篇多媒体新闻文章，内容涉及军事，经济和健康等一系列具有新闻价值的主题，并且基于信息性、多样性、具有较多插图等标准选择

最低0.47元/天解锁文章

开放知识图谱

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
论文浅尝 - ACL2020 | 用于多媒体事件提取的跨媒体结构化公共空间

笔记整理 | 王琰，东南大学来源：ACL 2020链接：https://arxiv.org/pdf/2005.02472.pdf概述本论文引入一项新任务：多媒体事件提取（M²E²），该任...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。