浊音&清音&爆破音时域及频域特性分析
概念区别
- 当气流通过声门时,如果声带的张力恰好使声带产生张弛震荡式振动,产生一股准周期脉冲七六,这一气流激励声道就产生浊音(Voiced Speech)或有声语音。
- 如果声带不振动,而声道在某处收缩,迫使气流以高速通过这一收缩部分而产生湍流,就产生清音(Unvoiced Speech)或摩擦音,或称无声语音。
- 如果声道在完全闭合的情况下突然释放就产生爆破音(Plosive Speech)。
——《实用语音识别基础》王炳锡等著
简单来说,在语音学中,将发音时声带振动的音称为浊音,声带不振动的音称为清音。辅音有清有浊,而多数语言中的元音均为浊音,鼻音、边音、半元音也是浊音。爆破音是指发音器官在口腔中形成阻碍,然后气流冲破阻碍而发出的音。
这里我利用Audacity,分别录制浊音i,清音s以及爆破音b进行时域频域分析,结果如下:
浊音时域及频域特性
结论1
浊音信号时域上表现为短周期性,波形较为规律;频域上表现为频率集中在低频区域,共振峰(声道管的谐振频率)较为明显,短时能量较高。
清音时域及频域特性
结论2
清音信号时域上表现为较低振幅,无规律振动;频域上各个频段都有分布,整体起伏较为和缓。
爆破音时域及频域特性
结论3
爆破音信号时域上,有从规律(类似浊音)到不规律(类似清音)的明显过度,从整体趋势来看,振幅降低;频域上语音频率较为集中,但是没有类似浊音一样明显的共振峰,起伏较清音更剧烈。
总结
没想到CSDN第一篇博客献给了作业,第一篇小红书是为了打广告,第一篇公众号过稿是为了网红店……
果然是无外力(利)而不往者
这个小作业不涉及编程,暂时不会让人头秃,在此鸣谢上学期的数字视音频处理和百度百科。