音频特征提取

本文介绍了食物声音识别中的音频特征提取,包括过零率、频谱质心、声谱衰减和色度频率等常见特征,并重点讨论了MFCC特征提取在语音识别中的应用及其步骤。
摘要由CSDN通过智能技术生成

食物声音识别的特征提取

当拿到一些音频数据后,怎么对这些数据进行处理呢?接下来我们了解一下怎么用一些特征来描述音频数据。

常见的音频特征提取

1、过零率

是一个信号符号变化的比率。即,在每帧中,语音信号从正变为负或从负变为正的次数,这个特征已在语音识别和音乐检索领域得到广泛应用,通常对类似金属、摇滚等高冲击性的声音具有更高的价值。一般情况下,过零率越大,频率近似越高。
Python实现

x , sr = librosa.load('./train_sample/aloe/24EJ22XBZ5.wav')
#绘制声波图像
plt.figure(figsize = (14,5))
librosa.display.waveplot(x, sr = sr)

n0 = 9000
n1 = 9100
plt.figure(figsize = (14,5))
plt.plot(x[n0:n1])
plt
  • 8
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值