1.0 摘要
声源定位领域采用最重要的特征是频域相位差IPD。然而,由于空域混叠(特别是高频部分),对IPD的利用有限,特别是麦克风间距较大时。近期,提出了相位替代方法。
1.1 介绍
声源定位任务采用最多的特征是IPD,然而,高频相位卷绕是个问题。一些算法尝试解决相位卷绕,从而解决空域混叠问题。
1.2 空域卷积和相位替代法
观察到的相位差计算如下公式,其中X1和X2为信号的短时傅里叶变换,n表示帧数,k表示频点。
基于远场假设,IPD和方向角之间的关系为
高频会存在相位卷绕问题,对于一个观察到的IPD会存在多个DOA与之对应,称之为空域混叠。
空域混叠影响的最低频率同DOA 和麦克风间距d有关。给定,最低频率为
虽然高频存在混叠问题,高频依然存在有效的DOA信息。
Chen et al. [13]提出了相位替代方法,考虑所有解卷的相位信息。
K表示频点数,表示频点K的最大解卷数。
IPD矩阵可以转换为DOA矩阵,第k列为
频带k的DOA直方图,通过统计所有帧数的DOA数量。
1.3 本文提出的方法
本文基于Chen et al. [13]提出了两个修改点,框图如下图