论文浅尝 | 重新思考多模态实体对齐中视觉模态的不确定性、缺失和模棱两可...

f3452ae98c06343482c74183877aa17b.png

笔记整理:徐雅静,浙江大学博士,研究方向为多模态知识图谱

链接:https://arxiv.org/pdf/2307.16210.pdf

1. 动机

现有的多模态实体对齐方法(MMEA)主要集中在多模态实体特征的融合范式上,而忽视了视觉图像普遍存在的缺失现象和内在模糊性所带来的挑战。在本文中,作者进一步分析了视觉模态不完备问题及对MMEA模型的影响,并在作者提出的MMEA-UMVM数据集上对最新的MMEA模型进行了基准测试。研究表明,面对模态的不完备,模型屈服于模态噪声的过拟合,并在高缺失模态率下表现出性能震荡或下降。为了解决这一挑战,作者提出了一种多模态实体对齐方法-UMAEA,该模型在减轻模态不完整的负面影响的同时实现了最先进的性能。

2. 贡献

本文的主要贡献有:

(1)模型局限性的识别:通过对MMEA- UMVM数据集的研究,揭示了现有MMEA模型在面对模态不完备时的局限性。本文确定了模型过度拟合模态中存在的噪声的趋势,以及在高缺失模态率下产生的性能振荡或下降。

(2)UMAEA:为了解决模态不完备带来的挑战,作者提出了UMAEA,一种强大的多模态实体对齐方法。UMAEA始终在MMEA-UMVM数据集中的所有97个基准分割中实现最先进的性能。它优于现有的基线,同时需要有限的参数和时间消耗。UMAEA有效地解决了与缺失和模糊视觉模式相关的不确定性。

3. 方法

总体框架如Figure 2所示,整个过程主要分为两个阶段。第一阶段的主要目标是在整个训练过程中减轻模态噪声和不完整性对对齐过程的影响。第二阶段旨在使模型能够主动完成缺失的模态信息。

  • 26
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【资源介绍】 基于Java的大规模在线课堂教师多模态情感与学生行为相关性的可视分析方法源码.zip基于Java的大规模在线课堂教师多模态情感与学生行为相关性的可视分析方法源码.zip基于Java的大规模在线课堂教师多模态情感与学生行为相关性的可视分析方法源码.zip基于Java的大规模在线课堂教师多模态情感与学生行为相关性的可视分析方法源码.zip基于Java的大规模在线课堂教师多模态情感与学生行为相关性的可视分析方法源码.zip 基于Java的大规模在线课堂教师多模态情感与学生行为相关性的可视分析方法源码.zip 基于Java的大规模在线课堂教师多模态情感与学生行为相关性的可视分析方法源码.zip 基于Java的大规模在线课堂教师多模态情感与学生行为相关性的可视分析方法源码.zip 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用!有问题请及时沟通交流。 2、适用人群:计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、自动化、电子信息等)在校学生、专业老师或者企业员工下载使用。 3、用途:项目具有较高的学习借鉴价值,也适用于小白学习入门进阶。当然也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 4、如果基础还行,或者热爱钻研,亦可在此项目代码基础上进行修改添加,实现其他不同功能。 欢迎下载,沟通交流,互相学习,共同进步!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值