短时自相关函数的基音提取方法
对于语音序列x(n),第i帧语音信号为,则短时自相关函数的定义为
k为时间延迟量。
短时自相关函数的重要性质:
1、若 是周期信号,周期为T,则也是周期信号,且周期相同。
2、当k=0时,短时自相关函数具有最大值,;在延迟量为0,,......时,周期信号的自相关函数也达到最大值。
3、短时自相关函数是偶函数。
短时自相关基音提取的原理为:比较原始信号与延迟信号之间的相关性来确定基音周期。若延迟量等于基音周期,那么两个信号具有最大相关性;或通过找出其自相关函数最大值之间的距离,即为基音周期的估计值。
具体步骤如下
1、分帧处理
f0min=50,f0max=500,N=128
fl为信号的帧数,fs/f0min=基音周期的最大值,
2、窗函数选择
窗函数采用汉宁窗,具体原因参见文章
3、信号加窗,归一化自相关
ux为语音信号的直流分量,先去除直流分量,然后加窗,然后求其归一化自相关函数
4、窗函数归一化自相关
5、原信号自相关
6、维特比算法求信号基音
求取
并以此递归找出最有基音集
优缺点:
1、对于噪声环境下的基音检测比较使用。
2、基音检测结果会出现二次倍频或二次分频的情况。
解决办法:
1、中心消波法自相关基音检测
L为消波电平,一般取信号帧的最大幅度的60%~70%
实验结果如下:
更多文章请关注公众号<<音频核>>