(二十九):Image-text Multimodal Emotion Classification via Multi-view Attentional Network

本文提出了一种名为多视图注意网络(MVAN)的新型模型,用于图文多模态情感分类。MVAN通过特征映射、交互学习和特征融合三个阶段,利用记忆网络深入探索图像-文本之间的交互,考虑了不同视角的图像特征。通过在大规模数据集TumEmo以及公开的MVSA数据集上的实验,MVAN在多模态情感分析任务上表现出优于现有基线模型的性能。
摘要由CSDN通过智能技术生成

  • 出处:IEEE 2020
  • 标题:基于多视角注意网络的图文多模态情感分类

Abstract

与单模态内容相比,多模态数据更能生动有趣地表达用户的感受和情感。因此,多模态情感分析成为一个热门的研究课题
然而,现有的方法要么是:独立学习情感模态特征,而没有考虑它们之间的相关性,要么是:简单地整合多模态特征。
此外,大多数公开的多模态数据集是通过情感极性来标记的,而用户表达的情感是特定的。

基于这一观察结果,在本文中,我们构建了一个名为TumEmo的大规模图像-文本情感数据集(即,用不同的情绪标记),该数据集包含Tumblr(Tumblr是一个由大卫·卡普在2007年创立的微博和社交网站,目前归Automattic所有。该服务允许用户发布多媒体内容和其他内容到简短的博客。用户可以关注其他用户的博客。)的超过19万个实例。进一步提出了一种基于多视图注意网络(MVAN)的多模态情感分析模型,该模型利用不断更新的记忆网络来获取图像-文本的深度语义特征
该模型包括特征映射、交互学习和特征融合三个阶段:
· 在特征映射阶段,我们利用物体视角和场景

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Laura_Wangzx

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值