链接为学习时发现的比较详细的讲解,方便自己以后翻阅所用
原理,如何一步步得到mfcc:
语音信号的梅尔频率倒谱系数(MFCC)的原理讲解及python实现 - 凌逆战 - 博客园
谱图讲解,语谱图来源:
语音识别中MFCC频谱和如何得到频谱图的图示讲解_躺在相片里等的博客-CSDN博客_mfcc图
原意是想找MFCC频谱图纵坐标代表什么,上面的文章都没有具体指出,以下为个人见解
mfcc = librosa.feature.mfcc(y=data, sr=sr)
librosa.display.specshow(mfcc, x_axis='time')
plt.ylabel('MFCC')
plt.colorbar()
plt.show()
这里用默认值n_mfcc=20,表示返回的mfcc个数是20
debug可看到这段音频得出的全部mfcc系数: