【数据压缩（一）】基于Audacity分析浊音、清音、爆破音时频特性

最新推荐文章于 2024-07-26 13:24:37 发布

zyzcuczyu

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量321

点赞数

文章标签：语音识别人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zyzcuczyu/article/details/114481038

版权

基于Audacity分析浊音、清音、爆破音时频特性

分析音频的可能性
录制浊音、清音、爆破音
浊音/a/分析
- /a/的时域分析
- /a/的频域分析
清音/q/分析
- /q/的时域分析
- /q/的频域分析
爆破音/p/分析
- /p/的时域分析
- /p/的频域分析
总结

分析音频的可能性

虽然人的发声系统（声带、口腔等）是时变的，但是这种变化相对于传声环境而言是快速的，因此语音信号具有短时平稳特性。根据人语音的短时平稳性，我们可以截取一小段的音频进行分析。

录制浊音、清音、爆破音

本来以为要先录音好再导入进去就提前录了三段音频，打开Audacity后发现软件内部可以进行录制剪辑等操作，更加方便，就舍弃了事先录好的音频直接在软件内录制。分别录制了浊音/a/、清音/q/、爆破音/p/。

浊音/a/分析

/a/的时域分析

在Audacity中，选取0.7s~0.8s音频段分析。
在这里插入图片描述

查阅资料知道：浊音信号时域上表现为短周期性，波形较为规律。
由上图可以看出：录制的浊音时域波形大致上具有周期性，波形较为规律。
故实验现象符合结论。

/a/的频域分析

从软件中直接导出Hanning窗下的频谱图如下。
在这里插入图片描述
查阅资料可知：浊音信号频域上表现为频率集中在低频区域，共振峰(声道管的谐振频率)较为明显,短时能量较高。
参考上图可看出：录制的浊音频率集中在2kHz以下，共振峰较为明显，短时能量较高。
故实验现象符合结论。

清音/q/分析

/q/的时域分析

在Audacity中，选取0.1s~0.2s音频段分析。
在这里插入图片描述
查阅资料可知：清音在时域上无明显规律，短时特性类似于白噪音。
由上图观察得：时域上确实无周期性或其他规律，类似白噪音。
故实验现象符合结论。

/q/的频域分析

直接在Audacity中输出频谱如下。
在这里插入图片描述
查阅资料知：清音频谱高频能量大。
观察上图得：清音/q/频谱在高频能量最大。
故实验现象符合结论。

爆破音/p/分析

由于爆破音发声时间短，直接对全段进行分析。

/p/的时域分析

在这里插入图片描述
爆破音在时域上能量集中在一小段时间内，并很快降低至逐渐平缓。

/p/的频域分析

在这里插入图片描述
爆破音/p/的能量集中在中低频，并在大约1kHz后随着频率增高能量逐渐降低。

总结

本次实验学会了Audacity在音频分析方面的基本用法。
成功分析了浊音、清音、爆破音的时频特性。
浊音/a/和爆破音/p/在频谱上有些类似，暂不清楚两者之间的关系。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【数据压缩（一）】基于Audacity分析浊音、清音、爆破音时频特性

基于Audacity分析浊音、清音、爆破音时频特性分析音频的可能性录制浊音、清音、爆破音浊音/a/分析/a/的时域分析/a/的频域分析清音/q/分析/q/的时域分析/q/的频域分析爆破音/p/分析/p/的时域分析/p/的频域分析总结分析音频的可能性虽然人的发声系统（声带、口腔等）是时变的，但是这种变化相对于传声环境而言是快速的，因此语音信号具有短时平稳特性。根据人语音的短时平稳性，我们可以截取一小段的音频进行分析。录制浊音、清音、爆破音本来以为要先录音好再导入进去就提前录了三段音频，打开Audaci
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。