When 多模态 meets 信息抽取

ee229d1f3d82cb0ba5562958309e5564.gif

©PaperWeekly 原创 · 作者 | 宁金忠

单位 | 大连理工大学

研究方向 | 信息抽取

都 2222 年了,信息抽取领域早已经是诸神黄昏。然而,多模态方法的兴起给这个卷成麻花的领域带来的新的希望。就像阳光穿过黑夜,黎明悄悄划过天边,既然新的多模态风暴已经出现,我们怎能停滞不前?

6ac7d74c79984ee04ff6aabe2fbf58be.png

让我们通过本文了解一下信息抽取领域中多模态方法的最新进展。本文分为两大主要章节,第一章介绍多模态关系抽取任务(Multimodal Neural Relation Extraction, MNRE),第二章介绍多模态命名实体识别任务(Multimodal Named Entity Recognition MNER)。

4dc43e40fec78364e4e8a9e51c13fe95.png


多模态关系抽取

任务介绍:多模态关系抽取任务的一个例子如下图所示。和基于文本的关系抽取方法相比,其他模态数据(例如图片)中的提示信息有利于性能的提升。

626f581df0376a1546d42cc9f805ea91.png

1.1 MNRE

3a0a9a68ee0dbeeec9e37aac11af85ad.png

论文标题:

MNRE: A Challenge Multimodal Dataset for Neural Relation Extraction with Visual Evidence in Social Media Posts

收录会议:

ICME 2021

论文链接:

https://ieeexplore.ieee.org/document/9428274

代码链接:

https://github.com/thecharm/MNRE

Motivation:关系抽取模型在面对社交媒体领域中长度偏短且缺少有效内容的文本时表现乏善可陈。同样,远程监督方法面对这种情景也显得力不从心。于是,寻找文本之外的内容来补充文本信息势在必行。

Contribution:

  • 作者首次提出了多模态关系抽取这个任务,即利用图片中的视觉内容来对文本中缺失的信息进行补充。

  • 作者构建并发布了一个人工标注的多模态关系抽取数据集。该数据集包含 10089 条实例,包含 31 中关系类别。

  • 作者提出了几个多模态关系抽取的 baseline。

作者选择 Glove+CNN,BERTNRE,BERT+CNN 为本文的对比实验。在三个对比实验的基础上分别增加 Image Labels、Visual Objects、Visual Attention 做为多模态关系抽取的基准模型。

1.2 Mega

论文标题:

Multimodal Relation Extraction with Efficient Graph Alignment

收录会议:

ACM MM 2021

论文链接:

https://dl.acm.org/doi/abs/10.1145/3474085.3476968

代码链接:

https://github.com/thecharm/Mega

Motivation:使用 image-related information 对纯 text-based 信息中的缺失内容进行补充,从而提升社交媒体领域的关系抽取任务的性能。

Method:

97eca3ca2aefb53b3ec31e927579ea6d.png

对于输入文本,作者使用 BERT 作为语义特征编码器。除此之外,作者使用句法解析工具提取了文本的句法解析树。对于输入图片,作者提取出其中目标的  scene graph。作者使用双流模型结构分别从图关系结构和语义两个方面来对齐文本和图像两个模态的信息。在模态特征融合阶段,作者把包含双模态的图结构对齐信息和语义表示对齐信息融合成一个向量,然后将其与头尾实体的表示向量进行拼接,最终得出关系的预测。

ae8033929e198e0a2c62756ac6904663.png


多模态命名实体识别

相比于多模态关系抽取任务,多模态多模态命名实体(MNER)任务由于起步较早已经涌现出了较多的工作。本章节中,我们把多模态命名实体识别任务按照使用的模态划分为:(1)基于语音-文本的 MNER(2)基于汉字结构特征 MNER(3)基于图片-文本的 MNER。

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在3D表面重建中,适应性条纹投影用于避免图像饱和。饱和是指当投影的光线过亮时,图像中的某些区域会出现过曝或过暗的现象。为了解决这个问题,适应性条纹投影技术被引入。 适应性条纹投影技术根据场景的亮度情况调整投影光线的亮度,并在图像中生成相应的条纹纹理。这些条纹纹理具有不同的亮度和颜色,可以在图像中创建一个光照变化的效应。通过这种方式,适应性条纹投影技术可以在不同亮度的区域中保持图像的细节和清晰度,避免了图像饱和现象的发生。 在3D表面重建中,适应性条纹投影技术非常有用。当使用投影仪投影条纹图案到三维表面上进行重建时,不同区域的亮度可能有所不同。一些区域可能非常亮,而另一些区域可能非常暗。如果不处理好这些亮度差异,就会出现图像饱和现象,导致重建结果不准确。 适应性条纹投影技术通过实时调整投影光线的亮度,使得不同区域的亮度更加均衡。这样,被投影区域的光照变化就可以更好地还原,从而获得更准确的三维表面重建结果。同时,适应性条纹投影技术还可以根据场景的亮度变化自动调整投影光线的亮度,提高了系统的稳定性和适应性。 总之,适应性条纹投影技术是一种用于避免图像饱和的重要技术。在3D表面重建中,它通过实时调整投影光线的亮度,保持图像区域亮度的均衡,从而获得更准确的重建结果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值