python计算短时自相关函数 音频信号_librosa与python_speech_features

本文介绍了在语音识别领域中,librosa和python_speech_features两个模块的功能和区别。librosa功能更全面,涉及音频特征提取、谱图分解等,而python_speech_features专注于音频特征提取,如MFCC、滤波器组能量等。python_speech_features的预加重参数简化了高频信号增强操作。
摘要由CSDN通过智能技术生成

在语音识别领域,比较常用的两个模块就是librosa和python_speech_features了。

最近也是在做音乐方向的项目,借此做一下笔记,并记录一些两者的差别。下面是两模块的官方文档

LibROSA - librosa 0.6.3 documentation​librosa.github.io Welcome to python_speech_features’s documentation!​python-speech-features.readthedocs.io

直接对比两文档就可以看出librosa功能十分强大,涉及到了音频的特征提取、谱图分解、谱图显示、顺序建模、创建音频等功能,而python_speech_features只涉及了音频特征提取。就特征提取的实现方法和种类来看,两者也有所不同。

python_speech_features的特征

支持的特征:

  • python_speech_features.mfcc() - 梅尔倒谱系数
  • python_speech_features.fbank() - 滤波器组能量
  • python_speech_features.logfbank() - 对数滤波器组能量
  • python_speech_features.ssc() - 子带频谱质心特征

提取mfcc、logfbank特征的方法

from 

python_speech_features的比较好用的地方就是自带预加重参数,只需要设定preemph的值,就可以对语音信号进行预加重,增强高频信号。

python_speech_features模块提供的函数

python_speech_f

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值