基于Audacity分析浊音、清音、爆破音时频特性
分析音频的可能性
虽然人的发声系统(声带、口腔等)是时变的,但是这种变化相对于传声环境而言是快速的,因此语音信号具有短时平稳特性。根据人语音的短时平稳性,我们可以截取一小段的音频进行分析。
录制浊音、清音、爆破音
本来以为要先录音好再导入进去就提前录了三段音频,打开Audacity后发现软件内部可以进行录制剪辑等操作,更加方便,就舍弃了事先录好的音频直接在软件内录制。分别录制了浊音/a/、清音/q/、爆破音/p/。
浊音/a/分析
/a/的时域分析
在Audacity中,选取0.7s~0.8s音频段分析。
查阅资料知道:浊音信号时域上表现为短周期性,波形较为规律。
由上图可以看出:录制的浊音时域波形大致上具有周期性,波形较为规律。
故实验现象符合结论。
/a/的频域分析
从软件中直接导出Hanning窗下的频谱图如下。
查阅资料可知:浊音信号频域上表现为频率集中在低频区域,共振峰(声道管的谐振频率)较为明显,短时能量较高。
参考上图可看出:录制的浊音频率集中在2kHz以下,共振峰较为明显,短时能量较高。
故实验现象符合结论。
清音/q/分析
/q/的时域分析
在Audacity中,选取0.1s~0.2s音频段分析。
查阅资料可知:清音在时域上无明显规律,短时特性类似于白噪音。
由上图观察得:时域上确实无周期性或其他规律,类似白噪音。
故实验现象符合结论。
/q/的频域分析
直接在Audacity中输出频谱如下。
查阅资料知:清音频谱高频能量大。
观察上图得:清音/q/频谱在高频能量最大。
故实验现象符合结论。
爆破音/p/分析
由于爆破音发声时间短,直接对全段进行分析。
/p/的时域分析
爆破音在时域上能量集中在一小段时间内,并很快降低至逐渐平缓。
/p/的频域分析
爆破音/p/的能量集中在中低频,并在大约1kHz后随着频率增高能量逐渐降低。
总结
- 本次实验学会了Audacity在音频分析方面的基本用法。
- 成功分析了浊音、清音、爆破音的时频特性。
- 浊音/a/和爆破音/p/在频谱上有些类似,暂不清楚两者之间的关系。