(十六):多模态连续维度情感识别研究_张戈(硕士论文)

本文提出了一种针对连续维度情感空间的多模态情感识别方法,包括音/视频情感预测、双模态融合、情感识别框架建立和模态异常处理。通过建立加权组合增强型框架(W-SVR-GBRT)和改进的线性回归模型,提高了情感识别的准确率,同时解决了模态离群点的影响。实验使用了LIRIS-ACCEDE数据集,包含音频和视频两种模态,重点关注了模态间的互补性和异常情况处理。
摘要由CSDN通过智能技术生成

文献阅读(十六):多模态连续维度情感识别研究_张戈(硕士论文)

本文针对于连续维度情感空间提出了一种多模态情感识别方法,该方法主要分为四个步骤:

  • 1.音/视频情感预测,通过对音视频信号的处理,情感特征的提取以及模型的建立,从而预测连续维度情感。由于特征维度较大,需要使用有效降维方法决定输入变量阶次,确定多模态特征数量;
    本文对音频和视频双模态分别提取多种情感特征,分别提取浅层特征与深层特征。在音频模态中,浅层特征在音频中称为低水平描述子,本文主要提取了音频基本特性以及基于人耳听觉对音频频谱的特征等;深层特征主要通过低水平描述子建立高阶函数,从而达到对高阶高维音频特征的提取。本文关注了视频特征中的全局特征,如颜色、纹理以及通过使用卷积神经网络提取的深度特征等。
  • 2.双模态融合;
  • 3.情感识别框架建立;本文建立了加权组合增强型框架(W-SVR-GBRT),提出了使用多级加权回归框架,用于对多模态连续维度情感识别与预测。该模型分为四层,第一层是对音视频情感特征的提取;第二层基于特征级融合与决策级融合相结合的思想,将同一模态中的数据先进行特征级融合;第三层根据音频与视频的不同特性,分别使用性能最优的模型进行单模态回归;第四层对回归后的输出提出了改进的线性回归决策级融合策略,最终完成情感预测。
  • 4.多模态情感识别中模态异常情况处理。本文注意到单一模态对整体情感识别的影响&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Laura_Wangzx

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值