（二十九）：Image-text Multimodal Emotion Classification via Multi-view Attentional Network

最新推荐文章于 2025-01-20 23:37:49 发布

Laura_Wangzx

最新推荐文章于 2025-01-20 23:37:49 发布

阅读量984

点赞数

分类专栏： “情感分析”研究方向论文-精读总结

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37486501/article/details/117751247

版权

“情感分析”研究方向论文-精读总结专栏收录该内容

88 篇文章 ¥19.90 ¥99.00

订阅专栏

本文提出了一种名为多视图注意网络(MVAN)的新型模型，用于图文多模态情感分类。MVAN通过特征映射、交互学习和特征融合三个阶段，利用记忆网络深入探索图像-文本之间的交互，考虑了不同视角的图像特征。通过在大规模数据集TumEmo以及公开的MVSA数据集上的实验，MVAN在多模态情感分析任务上表现出优于现有基线模型的性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

（二十九）：Image-text Multimodal Emotion Classification via Multi-view Attentional Network

Abstract
I. INTRODUCTION
II. RELATED WORK
III. MULTI-VIEW ATTENTIONAL NETWORK FOR MULTIMODAL SENTIMENT ANALYSIS
- A：问题形式化
- B. Multi-view Attentional Network
IV. EXPERIMENTS
V. CONCLUSIONS

出处：IEEE 2020
标题：基于多视角注意网络的图文多模态情感分类

Abstract

与单模态内容相比，多模态数据更能生动有趣地表达用户的感受和情感。因此，多模态情感分析成为一个热门的研究课题。
然而，现有的方法要么是：独立学习情感模态特征，而没有考虑它们之间的相关性，要么是：简单地整合多模态特征。
此外，大多数公开的多模态数据集是通过情感极性来标记的，而用户表达的情感是特定的。

基于这一观察结果，在本文中，我们构建了一个名为TumEmo的大规模图像-文本情感数据集(即，用不同的情绪标记)，该数据集包含Tumblr（Tumblr是一个由大卫·卡普在2007年创立的微博和社交网站，目前归Automattic所有。该服务允许用户发布多媒体内容和其他内容到简短的博客。用户可以关注其他用户的博客。）的超过19万个实例。进一步提出了一种基于多视图注意网络(MVAN)的多模态情感分析模型，该模型利用不断更新的记忆网络来获取图像-文本的深度语义特征。
该模型包括特征映射、交互学习和特征融合三个阶段：
· 在特征映射阶段，我们利用物体视角和场景

了解本专栏

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Laura_Wangzx 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。