STFT和声谱图,梅尔频谱(Mel Bank Features)与梅尔倒谱(MFCCs) 最近小编在做ASC(Acoustic Scene Classification)问题,不管是用传统的GMM模型,还是用机器学习中的SVM或神经网络模型,提取声音特征都是第一步。梅尔频谱和梅尔倒谱就是使用非常广泛的声音特征形式,小编与它们斗争已有一段时间了,在此总结一下使用它们的经验。STFT和声谱图(Spectrogram)声音信号本是一维的时域信号,直观上很难看出频率变化规律。如果通过傅里叶变换把