语音识别等应用离不开音频特征的提取,最近在看音频特征提取的内容,用到一个python下的工具包——pyAudioAnalysis: An Open-Source Python Library for Audio Signal Analysis,该工具包的说明文档可以点击这里下载,对应的github链接点击这里。
这个工具包原说明文档支持的是Linux安装,且不能与python3很好地兼容,注意啦!
一、pyAudioAnalysis工具包简介
pyAudioAnalysis是一个音频处理工具包,主要功能如图:
其中Feature Extraction包括(顺序有先后):
补充说明一下:
- 1-Zero Crossing Rate:短时平均过零率,即每帧信号内,信号过零点的次数,体现的是频率特性
- 2-Energy:短时能量,即每帧信号的平方和,体现的是信号能量的强弱
- 3-Entropy of Energy:能量熵,跟频谱的谱熵(Spectral
Entropy)有点类似,不过它描述的是信号的时域分布情况,体现的是连续性 - 4-Spectral
Centroid:频谱中心又称为频谱一阶距,频