食物声音识别之音频数据特征提取 1.音频数据的特征。 常见的音频提取特征有过零率,频谱质心,声音衰弱以及色度频率,它们分别通过不同的方法对声音的不同特征进行分析。不同方法鉴别的音频提取效果也有不同。 例如过零率主要对类似金属等高冲击力的音频效果更佳。而频谱质心主要描述音色的物理参数。 下图为过零率分析图和计算方法 2.MFCC特征提取 短时傅里叶分析: 我的理解就是用这个方法可以将无法看出帧率变化规律的帧进行分割,再经过公式加工显示出特征明显的图像。 公式: