- 原理
通过一定的偏移,叠加相似性最高的窗口,从而实现音频时间的拉伸和压缩的效果。
-
具体步骤
-
将音频信号分成多个窗口,通常采用固定长度的窗口(比如20ms);
-
取第一帧,加汉宁窗(cosx);
-
间隔Ha取一帧,以该帧为中心,两边延伸Δmax,找出最相似的帧作为第二帧并加汉宁窗;
-
将第二帧和第一帧叠加,叠加步进为Hs
-
公式
r a t e = H a / H s rate = Ha / Hs rate=Ha/Hs
L o u t = L i n / r a t e L_{out} = L_{in} / rate Lout=Lin/rate
Hs固定,通常为帧长一半,