基于交互注意力机制的多模态情感识别算法

最新推荐文章于 2024-08-11 20:31:48 发布

crazy637

最新推荐文章于 2024-08-11 20:31:48 发布

阅读量3.1k

点赞数

分类专栏：论文阅读文章标签：自然语言处理情感分析 python 机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lfb637/article/details/115589048

版权

本文深入探讨了基于交互注意力机制的多模态情感识别算法，介绍了GATASA网络，该网络结合全局和局部注意力，用于文本和音频特征的交互计算。在处理多模态数据时，通过LSTM和CNN提取特征，并利用注意力机制突出关键信息，以提高情感识别的准确性。

摘要由CSDN通过智能技术生成

基于交互注意力机制的多模态情感识别算法

论文介绍

原著:
《基于交互注意力机制的多模态情感识别算法》
2021 Application Research of Computers

研究问题

多模态机制下的情感识别，在多模态下，需要提取大量的特征。但特征数量多，造成一是训练参数增大。二是产生噪声，关键信息被遗漏。在模型融合时，要关注主要特征，因此需引入注意力机制。

研究方法

文章研究文本+语音的多模态。提出的多交互注意力机制网络：GATASA(Global Acoustic-to-text and Acoustic-to-Self Acoustic to Text) 。两（互补）部分组成：1、GATA ：强调所有的信息。2、ASATA：强调局部信息。这两部分由两种不同的注意力机制在文本和音频特征之间交互计算注意力分数。

深度学习中的文本数据处理：去掉不需要的停止词(stop word) -> 对单词做词嵌入(embedding)。词嵌入通常基于现有的词向量(word vector)、基于预训练的Glove 、BERT 。对于多个数据源的特征，可加入注意力机制。

注意力机制

处理思路：通过对特征向量计算权重分数并加权求和。通过不同的权重分数体现特征的重要性。

组成：

Query：单个输入向量
Key ：多个特征向量

注意力机制分数：过点积或可学习参数投影等方法计算出来的Key 和 Query 的相互关系。

最低0.47元/天解锁文章

关注

0
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。