音频特征提取

最新推荐文章于 2023-07-14 15:14:40 发布

热爱数学的小菜鸡

最新推荐文章于 2023-07-14 15:14:40 发布

阅读量4.2k

点赞数 8

分类专栏：机器学习文章标签：信号处理语音识别

本文链接：https://blog.csdn.net/weixin_43525495/article/details/115804589

版权

本文介绍了食物声音识别中的音频特征提取，包括过零率、频谱质心、声谱衰减和色度频率等常见特征，并重点讨论了MFCC特征提取在语音识别中的应用及其步骤。

摘要由CSDN通过智能技术生成

食物声音识别的特征提取

当拿到一些音频数据后，怎么对这些数据进行处理呢？接下来我们了解一下怎么用一些特征来描述音频数据。

常见的音频特征提取

1、过零率

是一个信号符号变化的比率。即，在每帧中，语音信号从正变为负或从负变为正的次数，这个特征已在语音识别和音乐检索领域得到广泛应用，通常对类似金属、摇滚等高冲击性的声音具有更高的价值。一般情况下，过零率越大，频率近似越高。
Python实现

x , sr = librosa.load('./train_sample/aloe/24EJ22XBZ5.wav')
#绘制声波图像
plt.figure(figsize = (14,5))
librosa.display.waveplot(x, sr = sr)

n0 = 9000
n1 = 9100
plt.figure(figsize = (14,5))
plt.plot(x[n0:n1])
plt

最低0.47元/天解锁文章

热爱数学的小菜鸡

关注

8
点赞
踩
42

收藏

觉得还不错? 一键收藏
0
评论
音频特征提取

食物声音识别的特征提取当拿到一些音频数据后，怎么对这些数据进行处理呢？接下来我们了解一下怎么用一些特征来描述音频数据。常见的音频特征提取1、过零率是一个信号符号变化的比率。即，在每帧中，语音信号从正变为负或从负变为正的次数，这个特征已在语音识别和音乐检索领域得到广泛应用，通常对类似金属、摇滚等高冲击性的声音具有更高的价值。一般情况下，过零率越大，频率近似越高。Python实现x , sr = librosa.load('./train_sample/aloe/24EJ22XBZ5.wav')#
复制链接

扫一扫