下面简单扼要的总结几个基本概念,如果想深入了解请告诉我或者直接参考相关文献。
一 语音信号的产生
一般来说,声音是通过振动产生的。同样,语音是肺里面的空气形成气流通过声道,再从口
鼻辐射而产生的。语音信号主要是由三种成分组成:浊音、清音和爆破音组成,这三种不同
的发音取决于声带的振动和发音器官(口鼻舌等)的位置和状态。如果用信号系统的角度来
看,气流通过声门(声带)形成激励源,从声门到口鼻这段腔体是一个时变的系统,当然语
音就是输出的时变信号了。只有搞清楚激励源和时变系统的特性,才能真正明白语音信号的
产生,从而进行更深入的研究。
二 描述语音特性的几个概念
1、物理属性:
1)音调:音高,是声音振动的频率;
2)音强:音量,声音震动的强弱;
3)音长:声音的长短;
4)音色:音质,声音的内容和特质,与声带振动频率、激励源和声道的形状等有
关。
2、基本单位
1)最基本的单位:音素,分为浊音和清音。
2)最小发音单位:音节,由音素组成。音节=元音+辅音,而没有说音节=浊音+清
音,这是因为二者不是一个领域范畴的表述,一个是语言学构成,另一个是语音成分组成,
另外辅音分为清辅音和浊辅音,元音和浊辅音表示了声带振动,清辅音声带不振动。
3)汉语语音=声母+韵母+音调
3、共振峰特性
当振动频率与系统的固有频率一致时,就会引起共振现象。声道是一个具有某种谐振特性的
腔体,可以与语音在多个频率上发生谐振,这些谐振的位置称为共振峰,它对语音信号产生
了很大的影响。
4、掩蔽效应
从人耳的感知特性出发,是一种心理声学现象,以后会再详细介绍。
三 语音信号与音频信号的关系
语音信号的频率范围是200~3400Hz左右,人们可听到的音频信号范围是20~20KHz,显然语音
信号属于音频信号,那为什么还特别强调语音信号的研究呢?
1、语音信号和音频信号的处理对象不同,语音信号主要是以人发声为研究对象,而音频信
号则是以自然界所有的声音为研究对象;
2、研究方法不同,语音信号主要从人的发声机理为基础,建立发声系统模型,分析系统特
性;而音频信号的来源太多了,所以它是以人的听觉特性为基础,建立人耳系统模型,分析
系统特性。
3、语音信号具有更多的实际研究价值和应用价值。
四 语音信号处理的常用技术
1、时域分析
通过将语音信号分帧,转化时变信号为时不变信号以进行处理。
1)短时能量
2)短时平均过零率
3)短时自相关运算
2、频域分析
1)傅里叶变换(FFT)
2)滤波器组(Filter Bank)
3)基于听觉特性的Mel频率倒谱分析
4)基于线性预测(LPC)的倒谱分析
3、两个关键参数
1)基音频率(Pitch)
2)线性预测系数(LPC)
五 语音信号处理的常用软件
1、Matlab
2、Cool Edit
。。。。。。