语音的情感识别问题

最近在看语音的情感识别相关文档,对其中的一些点有了初步的认识,记录下来与大家分享。

1、单从语料的音调就能识别出说话人的喜怒哀乐时,先进行语音信号的标注,提取情感的特征参数,包括基于声学的特征参数:LPCC(线性预测倒谱系数);基于人的听觉机理:MFCC、共振峰参数,还有基于韵律特征的基频和能量方面的特征,另外还可以从说话持续时长、振幅参数来考虑语音所表达出来的情感;

2、需要从语料的说话内容才能判断说话人的正负情绪时,这涉及到语义的理解问题。对测试的语料库的每个句子提取关键词,比如说话人不带强烈情感的说:话费扣的比**多,这是向移动客服表达一种不满,应为负面情绪,把话费、多连在一块儿,做成一个模板,当说话人再有此类语句,且音调正常时,表达的应是负面情绪;

对于语音情感的识别方法有;

矢量分割型马氏距离判别法、主元分析法、神经网络方法、隐马尔科夫模型(HMM)、混合高斯模型(GMM)


另外,情感是一个模糊的概念,对于情感的判别可以采用模糊熵的概念,设有模糊集A={x1,x2,x3,...xn},其对应的隶属度分别为u1,u2,...un,模糊熵的值为S为ui与ln ui乘积的求和的负值。

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值