语音情感计算理论基础

1.语音情感计算中情感的建模方法有哪些?有什么区别?情感计算主要应用于哪些领域?

  1. 支持向量机(SVM)、隐马尔可夫模型(HMM)、人工神经网路(NN)等。
    • SVM:基音+SVM算法=统计特征→识别语音状态;
    • HMM:输入特征矢量序列+训练=统计信号→识别语音状态;
    • NN:多层神经网路+训练=模拟人脑组织→识别语音状态。
  2. 虚拟人物、身份验证、智能用户界面、交互式感性图像检索、多功能机、语音识别、面部识别、军用可穿戴计算机等等。

2.列举三种以上的用于语音情感计算的声学特征,并解释其物理含义。

声学特征:
  • 音色。发音体形状、质地、构造不同,决定了音色的不同。
  • 音调。发音体声音频率的高低。
  • 音强。发音体振动的幅度特征。
  • 音长。发音体振动延续的时间特征。
语句特征:
  • 基频。基音的频率,决定了音高。在不同情感状态说,说同一段话,基频是不同的。一般研究基频的峰值、均值、方差等特征。
  • 低于250HZ的谱能量。根据parseval定理,信号傅氏变换模平方被称为谱能量。带有情绪的状态下谱能量和低于250HZ的谱能量时的存在一些规律。
  • 语速。讲一个语句的速度。不同情绪下的语速有规律性差异。
  • 能量。生气和高兴时能量高,其次平静,悲伤最低。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值