【论文笔记】使用对比知识注入的多模态情感分析方法

星晓太荒

于 2024-12-20 12:51:19 发布

阅读量1.1k

点赞数 20

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_55852758/article/details/144584371

版权

动机

现有方法主要依赖于预训练模型的通用知识，忽视了领域特定知识的重要性。ConKI通过知识注入技术整合了领域特定知识，增强了模型对特定情感的识别能力。

传统方法在模态间交互和融合方面存在局限，未能充分利用不同模态间的互补信息。ConKI通过层次化对比学习，加强了模态间的交互和融合，提升了情感预测的准确性。

现有模型在性能提升和泛化能力方面存在限制。ConKI框架通过外部数据集的知识注入和层次化对比学习，不仅提高了模型在特定数据集上的性能，也增强了模型对未知数据的泛化能力。

模型

总体架构

首先使用相应的特征提取器和分词器将原始多模态输入处理成低级特征 $I_{m\in \{t,v,a\}}$ 。然后，我们将 $I_m$ 编码成由适配器生成的知识特定表示（即 $A_m$ ）和由预训练编码器生成的泛知识表示（即 $O_m$ ）。文本编码器来自公开可用的预训练模型，如BERT，而视觉/音频编码器是设计好的模型，随机初始化。生成知识特定和泛知识表示后，ConKI将同时用下游目标数据集进行两项不同任务的训练——主要的MSA回归任务和对比学习子任务。

MSA回归任务

对于MSA任务，将每个模态的知识特定表示和泛知识表示进行拼接后，将它们送入全连接（FC）层进行模态内融合。然后我们设计了一个融合网络，包括一个拼接层和一个融合模块，用于多模态融合，如上图图所示。融合后的表示被送入多层感知器（MLP）网络以产生情感预测 $\hat y$ 。

对比学习子任务

对于层次化对比学习的子任务，在知识层面、模态层面和样本层面精心构建正负样本对。配对策略的如下：

1.期望 $A_m$ 和 $O_m$ 能够捕捉不同的知识，因此通过知识层面的对比将它们分开，使它们互补，以获得更丰富的模态表示。

2.由于视频的情感由所有模态决定，通过模态层面的对比学习六个表示之间的共同点。

3.表达相近情感的视频应该有一些相关性。通过样本层面的对比捕捉这种相关性，以帮助进一步学习在相近情感下的样本之间的共同点。

通过整合这些层次化的对比，ConKI能够捕捉到表示之间的全部动态，这可以显著地有益于主要的MSA任务。

知识注入

对于文本模态使用预训练的BERT模型来编码文本模态的输入句子。从最后一层提取的池化输出向量作为整个句子的表示：

最低0.47元/天解锁文章

博客等级

码龄4年

8
原创

163
点赞

142
收藏

70
粉丝

关注

私信

热门文章

最新评论

【论文笔记】EmoEdit：变化图像使它展现情感
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记】TFCD：多模态讽刺情感识别的无训练去偏方法
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记】基于相关性解耦的知识蒸馏在多模态情感分析中的应用
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记】使用对比知识注入的多模态情感分析方法
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文笔记】使用掩模模型具有密集交互作用的视听早期融合模型
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。