VTLN是Vocal Tract Length Normalisation 的简称。中文为:声道长度归一化。主要用于语音识别,消除男,女的声道长度的差异。在HTK中有源码,HTK book中有介绍。修改了MEL频率中的中心频率。
用到的参数:
WARPFREQ
LOFREQ
HIFREQ
variables (WARPLCUTOFF) and (WARPUCUTOFF).
变量IOConfigRec
变量赋值defConf
在函数InitFBank中
赋值
alpha = 0.8;
warpLowCut = 60;
warpUpCut = 4000;