一种深度信念网络的语音情感识别方法及系统
技术领域
本系统涉及语音识别领域,特别是涉及一种深度信念网络的语音情感识别方法及系统。
背景技术
随着云计算、移动互联网、大数据的发展,机器为人类服务愈加智能化,人与机器用自然语言进行对话的梦想逐步接近实现,人们对机器交互能力的要求也越来越高。简单的语音内容的识别已经不能满足人们的要求,处理、识别和理解语音中的情感在实际应用中已经变得尤为重要。语言情感识别具有非常广阔的应用前景,它不仅可以应用于人机交互系统,还可以用于语音识别,增强语音识别的鲁棒性;或者用于说话人辨别,提高说话人辨别率。语音情感识别技术在智能人机交互、人机交互教学、得到广泛的应用。自动语言情感识别的研究,不但能够推动计算机技术的进一步发展,它也将大大提高了人们的工作和学习效率,提高人们的生活质量。
对外界各种情感信号进行采样来识别各种情感,在深度神经网络研究方面,对于情感分类的准确性低,在模式识别方面,采用现有技术中的基于神经网络提取语音中的情感,对于悲伤、兴奋、欢乐和愤怒情感的识别率较低,采用自适应神经网络对语音情感状态的识别率也较低。
采用传统的神经网络在训练时,网络各层是作为整体一起训练的,当面临大数据情况时,就会增加网络的训练时间,使网络的收敛速度变得更慢。反向传播算法是神经网络训练中最常用到的方法,通过迭代的方法来训练整个神经网络,网络参数采用随机化的方式进行初始化,利用当前计算所获得的网络最顶层的输出值和数据的实际值之差来调整网络各层的参数,采用传统的梯度下降法,更新参数的目标是使得网络预测值与真实值更为接近,但是,采用随机初始化的方式来初始化网络参数,会导致网络更新时越往下误差校正信号越弱,梯度也变得更加稀疏,从而网络容易陷入局部最优。所以导致语音情感状态的识别率低。
发明内容
本系统的目的是提供一种能够提高语音情感识别率的深度信念网络的语音情感识别方法及系统。
为实现上述目的,本系统提供了如下方案:
一种深度信念网络的语音情感识别方法,其特征在于,所述识别方法包括:
获取语音信号;
预处理所述语音信号,获得预处理语音信号;