浅谈语音信号处理系列之二 语音信号处理的基础

下面简单扼要的总结几个基本概念,如果想深入了解请告诉我或者直接参考相关文献。

一 语音信号的产生

一般来说,声音是通过振动产生的。同样,语音是肺里面的空气形成气流通过声道,再从口

鼻辐射而产生的。语音信号主要是由三种成分组成:浊音、清音和爆破音组成,这三种不同

的发音取决于声带的振动和发音器官(口鼻舌等)的位置和状态。如果用信号系统的角度来

看,气流通过声门(声带)形成激励源,从声门到口鼻这段腔体是一个时变的系统,当然语

音就是输出的时变信号了。只有搞清楚激励源和时变系统的特性,才能真正明白语音信号的

产生,从而进行更深入的研究。

二 描述语音特性的几个概念
1、物理属性:
 1)音调:音高,是声音振动的频率;
 2)音强:音量,声音震动的强弱;
 3)音长:声音的长短;
 4)音色:音质,声音的内容和特质,与声带振动频率、激励源和声道的形状等有

关。
2、基本单位
 1)最基本的单位:音素,分为浊音和清音。
 2)最小发音单位:音节,由音素组成。音节=元音+辅音,而没有说音节=浊音+清

音,这是因为二者不是一个领域范畴的表述,一个是语言学构成,另一个是语音成分组成,

另外辅音分为清辅音和浊辅音,元音和浊辅音表示了声带振动,清辅音声带不振动。
 3)汉语语音=声母+韵母+音调
3、共振峰特性
当振动频率与系统的固有频率一致时,就会引起共振现象。声道是一个具有某种谐振特性的

腔体,可以与语音在多个频率上发生谐振,这些谐振的位置称为共振峰,它对语音信号产生

了很大的影响。

4、掩蔽效应
   从人耳的感知特性出发,是一种心理声学现象,以后会再详细介绍。

三 语音信号与音频信号的关系
语音信号的频率范围是200~3400Hz左右,人们可听到的音频信号范围是20~20KHz,显然语音

信号属于音频信号,那为什么还特别强调语音信号的研究呢?
1、语音信号和音频信号的处理对象不同,语音信号主要是以人发声为研究对象,而音频信

号则是以自然界所有的声音为研究对象;
2、研究方法不同,语音信号主要从人的发声机理为基础,建立发声系统模型,分析系统特

性;而音频信号的来源太多了,所以它是以人的听觉特性为基础,建立人耳系统模型,分析

系统特性。
3、语音信号具有更多的实际研究价值和应用价值。

四 语音信号处理的常用技术
1、时域分析
   通过将语音信号分帧,转化时变信号为时不变信号以进行处理。
 1)短时能量
 2)短时平均过零率
 3)短时自相关运算 
2、频域分析
 1)傅里叶变换(FFT)
 2)滤波器组(Filter Bank)
        3)基于听觉特性的Mel频率倒谱分析
        4)基于线性预测(LPC)的倒谱分析
3、两个关键参数
 1)基音频率(Pitch)
 2)线性预测系数(LPC)

五 语音信号处理的常用软件
1、Matlab
2、Cool Edit
。。。。。。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值