常用的取样频率:16k或24k8bit[-128,127] 和16bit编码[-32768,32767],.wav文件被提取后得出的结果eg:(32,80,789) 首先80就是每个窗口长度是80 ,共789个窗口。比如:帧移动可以是12.5毫秒 提取完特征之后通过stft变换变成一个谱特征