要让电脑识别语音信号,必须经过一系列的处理。
一.录制一段音频,wav格式
二.用倒谱系数法提取特征值。
MFCC,Mel频率倒谱系数的缩写。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。
我这里用的是一个语音工具箱voicebox,里面有一个函数melcepst.m可以方便的求MFCC。
关于提取的详细过程:
预滤波:CODEC前端带宽为300-3400Hz的抗混叠滤波器。