Multiple Sound Source Localization Based on IPD in All Frequencies with Spectral Masks

文章探讨了在声源定位中遇到的高频相位卷绕和空域混叠问题,特别是在大间距麦克风设置下。提出了一种相位替代方法,该方法考虑所有解卷的相位信息来处理IPD,从而转换为DOA矩阵,通过频带的DOA直方图统计来克服高频信息的混叠问题。
摘要由CSDN通过智能技术生成

1.0 摘要

声源定位领域采用最重要的特征是频域相位差IPD。然而,由于空域混叠(特别是高频部分),对IPD的利用有限,特别是麦克风间距较大时。近期,提出了相位替代方法。

1.1 介绍

声源定位任务采用最多的特征是IPD,然而,高频相位卷绕是个问题。一些算法尝试解决相位卷绕,从而解决空域混叠问题。

1.2 空域卷积和相位替代法

观察到的相位差计算如下公式,其中X1和X2为信号的短时傅里叶变换,n表示帧数,k表示频点。

 基于远场假设,IPD和方向角之间的关系为

高频会存在相位卷绕问题,对于一个观察到的IPD会存在多个DOA与之对应,称之为空域混叠。

空域混叠影响的最低频率同DOA  \theta和麦克风间距d有关。给定\theta,最低频率为

       

 虽然高频存在混叠问题,高频依然存在有效的DOA信息。

Chen et al. [13]提出了相位替代方法,考虑所有解卷的相位信息。

 K表示频点数,A_{K}表示频点K的最大解卷数。

 IPD矩阵可以转换为DOA矩阵\Theta (n),第k列为

 频带k的DOA直方图,通过统计所有帧数的DOA数量。

1.3  本文提出的方法

本文基于Chen et al. [13]提出了两个修改点,框图如下图

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值