读取音频
提取特征Log-Mel Spectrogram
MFCC
绘制波形图和梅尔频谱图
prerequisites
install
起始点检测 onset detection tutorial
librosa
Librosa是一个用于音频、音乐分析、处理的python工具包,一些常见的时频处理、特征提取、绘制声音图形等功能应有尽有,功能十分强大
安装
pip install librosa
分析步骤
-专业名词:- sr:采样率、hop_length:帧移、overlapping:连续帧之间的重叠部分、n_fft:窗口大小、spectrum:频谱、spectrogram:频谱图或叫做语谱图、amplitude:振幅、mono:单声道、stereo:立体声
读取音频
# 加载音频
data,sample_rate = librosa.load('./test.wav')
print('data:',data.shape,'sample_rate:',sample_rate)