Audacity语音分析--数据压缩部分实验

本文详细介绍了通过Audacity软件对清音f、浊音ao和爆破音b的音频进行时域和频域分析,揭示了它们的特性区别,包括声带振动、能量分布和频谱特征。通过实例验证了清音的高频特性、浊音的低频集中及爆破音向清音过渡的现象。
摘要由CSDN通过智能技术生成


作者:赤赤子

了解清音浊音爆破音及其性质

清音

清音:当气流通过声门时,如果声道中某处面积很小,气流高速冲过此处时产生湍流,当气流速度与横截面积之比大于某个临界速度便产生摩擦音,即清音。

我们可以总结为清音发声时声带不需震动。举例为:p、t、k、c、q、f、s。

浊音

浊音:语音学中,将发音时声带振动的音称为浊音,声带不振动的音称为清音。辅音有清有浊,而多数语言中的元音均为浊音,鼻音、边音、半元音也是浊音。

我们可以总结为清音发声时声带需震动。举例为:U、ao等常见发音。

爆破音

爆破音:爆破音是指发音器官在口腔中形成阻碍,然后气流冲破阻碍而发出的音。在某些情况下,发爆破音时气流不必冲破阻碍,而只是发音器官在口腔中形成阻碍,并稍做停顿即可。

其中清音和浊音都分别有其爆破音。如:p、g。

进行Audacity音频分析

这里我选取了清音f,浊音ao,爆破音b录制了三段音频分别用audacity音频软件进行了裁剪与时频域分析,结果如下。由于语音信号具有短时平稳性,在20ms-30ms内是平稳的便于分析。因此在10ms量级上取50ms分帧处理对语音信号进行分析观察。

清音f

时域分析

时域分析清音f
幅度较小未控制与浊音的强度一致,不过应该不影响频率分析。

频域分析

频域分析清音f

总结

对于清音来说能量集中在高频区,这一点其实对照浊音的频谱可以较为明显的看出。但是其实从图像上来看频域上各个频段都有分布,整体起伏较为和缓。而短时平均过零率高得离谱,导致我放大了好几倍才看的清谱线。相比而言,清音更相似于白噪声。

浊音ao

时域分析

时域分析浊音ao

频域分析

频域分析浊音ao

总结

浊音能量较为集中的分布在低频区,高频区基本没有谱线了。共振峰较为明显(这里好像也不太明显不过可能是其余条件干扰?),短时能量较高。可以分析出浊音的短时平均过零率远远小于清音。而从时域上看可以清楚的看清它的周期,有一个一个的幅值波动,而幅值变化也较为平缓。

爆破音b

时域分析

时域分析爆破音bo

频域分析

频域分析爆破音bo

总结

由于选择的是浊音爆破音b,所以其大致谱线与浊音谱线类似,其能量集中在低频区,却已经没有了明显的共振峰,明显的向清音的不规则谱线出现了靠拢的趋势。短时能量很高。

性质验证

其实可能是由于录制带来的噪音或者是格式转换时对音频的影响,部分结果并不规范,只能验证,而无法较为明显的看出,这里我采取的是手机录音然后由m4a格式转换到MP3然后分析的方式,这是由于Audacity需要下载一个库文件。不知道转换成wav的话对结果会不会有一定影响,有机会仍会探究。
以上内容是第一次数据压缩实验内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值