声谱图(基于短时傅里叶变换(STFT)的画法).DOC
声谱图(基于短时傅里叶变换(STFT)的画法)
1.自定义函数
分为宽带声谱图和窄带声谱图,横坐标表示时间,纵坐标表示频率,图像中的灰度代表某时刻对应该频率处的能量,此处为短时傅里叶变换幅度的平方。
将能量函数归一化,最大值归一化为电平1,最小值归一化为电平0;为了得到更好的显示效果,可以选择适当的基准值Base(基准电平),把小于Base值限定在此基准电平上,把大于Base的值线性映射到0~1的归一化彩色值。
程序中wavread(Wavnam)读入的语音信号样值赋给矩阵Sg,也即待分析信号x(n),采样频率赋给Fs。Winsiz:定义帧长,一般应取2的幂次,其目的是适合FFT的要求。通过对Winsiz的选值可实现宽带频谱或窄带频谱的选择。Shift:定义帧移值。一般此值小于或等于Winsiz。Shift值越小,时域分辨率越高。Base:基准电平值。注意,此值的设定需根据实际经验,可以通过在多次运行此程序中给出不同的Base值,观察所获得的频谱图的视觉和分辨率效果,选择一个合适的Base值,如果没有特别要求,可取默认值Base=0。Mode:定义显示模式。1伪彩色映射, 0为灰度映射。上述程序中,伪彩色映射采用默认值’default’也即jet,可选的其它映射还有:bone,cool ,copper,flag,hot,hsv,pink, prism。Gray:灰度显示层数,当Mode=0时有效