（十六）：多模态连续维度情感识别研究_张戈（硕士论文）

最新推荐文章于 2023-02-15 16:36:05 发布

Laura_Wangzx

最新推荐文章于 2023-02-15 16:36:05 发布

阅读量808

点赞数

分类专栏： “情感分析”研究方向论文-精读总结

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37486501/article/details/116170640

版权

“情感分析”研究方向论文-精读总结专栏收录该内容

88 篇文章 200 订阅 ¥19.90 ¥99.00

订阅专栏

本文提出了一种针对连续维度情感空间的多模态情感识别方法，包括音/视频情感预测、双模态融合、情感识别框架建立和模态异常处理。通过建立加权组合增强型框架(W-SVR-GBRT)和改进的线性回归模型，提高了情感识别的准确率，同时解决了模态离群点的影响。实验使用了LIRIS-ACCEDE数据集，包含音频和视频两种模态，重点关注了模态间的互补性和异常情况处理。

摘要由CSDN通过智能技术生成

文献阅读（十六）：多模态连续维度情感识别研究_张戈（硕士论文）

本文针对于连续维度情感空间提出了一种多模态情感识别方法，该方法主要分为四个步骤：

1.音/视频情感预测，通过对音视频信号的处理，情感特征的提取以及模型的建立，从而预测连续维度情感。由于特征维度较大，需要使用有效降维方法决定输入变量阶次，确定多模态特征数量；
本文对音频和视频双模态分别提取多种情感特征，分别提取浅层特征与深层特征。在音频模态中，浅层特征在音频中称为低水平描述子，本文主要提取了音频基本特性以及基于人耳听觉对音频频谱的特征等；深层特征主要通过低水平描述子建立高阶函数，从而达到对高阶高维音频特征的提取。本文关注了视频特征中的全局特征，如颜色、纹理以及通过使用卷积神经网络提取的深度特征等。
2.双模态融合；
3.情感识别框架建立；本文建立了加权组合增强型框架(W-SVR-GBRT)，提出了使用多级加权回归框架，用于对多模态连续维度情感识别与预测。该模型分为四层，第一层是对音视频情感特征的提取；第二层基于特征级融合与决策级融合相结合的思想，将同一模态中的数据先进行特征级融合；第三层根据音频与视频的不同特性，分别使用性能最优的模型进行单模态回归；第四层对回归后的输出提出了改进的线性回归决策级融合策略，最终完成情感预测。
4.多模态情感识别中模态异常情况处理。本文注意到单一模态对整体情感识别的影响&#

了解本专栏

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Laura_Wangzx 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。