对信号分析最自然直接的方法是以时间为自变量进行分析,音频信号典型的时域特征包括短时能量、短时平均过零率、短时自相关系数和短时平均幅度差等。在这一节中主要对这些时域的特征及它们的具体应用加以介绍。
1. 短时能量分析
音频信号的能量随着时间变化比较明显,其短时能量分析给出了反应这些幅度变化的一个合适的描述方法。对于信号i(n) ,短时能量的定义如下:
上式表示在信号的第n个点开始加窗函数时的短时能量。可以看出,短时能量可以看作音频信号的平方经过一个线性滤波器的输出,该线性滤波器的单位冲激响应为h(n).如图下所示。
冲激响应h(n)的选择,或者说窗函数的选择,决定了短时能量表示方法的特点。为了反映窗函数选择对短时能量的影响,假设上式中的h(n)非常长,且为恒定幅度,那么E,随时间的变化将很小,这样的窗就等效为很窄的低通滤波器。很明显,我们要求的是对音额信号进行低通滤波,但还不是很窄的低通滤波,至少短时能量应能反映音频信号的幅度变化。因此出现了窗长选取上的矛盾,这种矛盾将在音频信号的短时表示方法的研究中反复出现。即希望有一个短时窗(冲激响应)以响应快速的幅度变化。但是,太窄的窗将得不到平滑的能量函数,并且窗函数的形状和长短直接影响