帧移:帧移后的每一帧信号都有上一帧的成分,防止两帧之间的不连续。语音信号虽然短时可以认为平稳,但是由于人说话并不是间断的,每帧之间都是相关的,加上帧移可以更好地与实际的语音相接近。
加窗:由于直接对信号(加矩形窗)截断会产生频率泄露,为了改善频率泄露的情况,加非矩形窗,一般都是加汉明窗,因为汉明窗的幅频特性是旁瓣衰减较大,主瓣峰值与第一个旁瓣峰值衰减可达40db。
频谱泄露(截断效应):信号为无限长序列,运算需要截取其中一部分(截断),于是需要加窗函数,加了窗函数相当于时域相乘,于是相当于频域卷积,于是频谱中除了本来该有的主瓣之外,还会出现本不该有的旁瓣,这就是频谱泄露!为了减弱频谱泄露,可以采用加权的窗函数,加权的窗函数包括平顶窗、汉宁窗、高斯窗等等。而未加权的矩形窗泄露最为严重。频谱泄露就是分析结果中,出现了本来没有的频率分量。
先验信噪比:先可以是方差,一阶统计量是均值,二阶统计量方差对应能量,但是具体计算的时侯不一定非得用方差。
后验 观测信号的能量(signal+noise)与noise能量的比值,当然这个noise的能量是你估计出来的,只是一个估计值。。。
就是比如你观察到的信号是 signal+ noise,此时的signal 与noise的能量比就是先验信噪比,当然一般算的是signal的估计值与noise的估计值的能量比。
当然这个值是根据你的观测矢量算出来的。那还有一个后验的信噪比,指的是观测信号与noise的能量比。
MMSE算法:
利用已经有的观测量 估计估计量的取值,减小关于估计量的不确定性
估值:
利用已有的观测量的信息,
估计估计量的取值,
减小关于估计量的不确定性。
1
均方误差最小的估值问题
均方误差最小的估值问题
设
ξ
和
η
是两个随机矢量,
两者存在联合分布,
设
η
是观察矢量,
通过
η
对
ξ
进行
估值,求均方误差最小的估值ξ。
{
}
Y
η
K
ξ
Y
η
)
(
η
ξ
ξ
=
−
=
⎭
⎬
⎫
⎩
⎨
⎧
=
−
/
min
/
ˆ
2
2
E
E
,其中
1
2
(
,
)
n
K
k
k
k
τ
=
,……,
为任意矢量。