麦克风阵列声源定位四通道麦克风数据库及TDOA双曲交汇定位算法实验

麦克风阵列声源定位四通道麦克风数据库建立

图一 四通道麦克风数据库建立物理模型
四通道麦克风数据库建立物理模型的建立,来源于文献:SLoClas: A DATABASE FOR JOINT SOUND LOCALIZATION AND CLASSIFICATION图二 参考文献1
根据图一,声源处于红色圆形上,且声源距离麦克风阵列中心O点的距离为1.5m,其中
mic1(0,-d)、mic2(d,0)、mic3(0,d)、mic4(-d,0) d为0.03m
声源会沿着红色圆圈按照θ角度旋转,麦克风阵列会依次按照一定的采样率每θ角度采集相同数据长度的声源数据,不同麦克风会因为距离角度而导致采集到的信号的幅度和相位不同。实验数据是按照θ=5°采集完成的,实验部分数据集如下图:
图三 不同角度下的麦克风阵列定位数据集
图四 麦克风阵列定位数据集下的声音文件
图五 麦克风阵列定位数据集下采集的四通道声音时域波形图

TDOA相关法时延求解

TDOA相关法时延求解原理与算法

双曲交汇定位算法

参考文献:运 用 双 曲 线 知 识 测 定 声 源
———研究性学习课题成果

图六 参考文献二双曲交汇算法
结合图一,以mic2、mic4为焦点构建双曲线方程1:
图七 双曲线方程1
以mic1、mic3为焦点构建双曲线方程2:
图七 双曲线方程2
现在定义,T42为声源到mic4的时间与声源到mic2的时间的差,T13为声源到mic1的时间与声源到mic3的时间的差c为声音传播的速度,在这里c=340m/s。
根据双曲线的特性,其中,
图八 双曲线方程1的参数
图九 双曲线方程2的参数
两个双曲线方程联立求解,双曲线的交点就是声源的坐标。根据作者何晓东 郑东风 指导教师 支 静的文献,联立两个双曲线方程组求解得:
图十 声源位置
我们只需要根据T42和T13和0的关系来判定声源的具体位置即可,如下图所示:
图十一 T42和T13和0的关系与声源的具体位置判定

声源位置、角度求解与算法代码验证

matlab的算法代码如下:

clc;
clear;
close all
m=100;
filedir=('E:\***\SoClas_database\Segmented_Sound\class06\class06_360\*.wav');%%
infiledir=('E:\***\SoClas_database\Segmented_Sound\class06\class06_360\');
files = dir(filedir);
for num = 1:m
    infile = [infiledir,files(num).name];
    [y0,Fs]= audioread(infile);
    for j = 1:3
        [c,lags] = xcorr(y0(:,j+1),y0(:,1));
        [Am,Lm] =  max(c);
        d = Lm - (length(c)+1)/2;
        Delay(num,j)=d/Fs;
    end
    for k = 1:2
        [c1,lags1] = xcorr(y0(:,k+2),y0(:,2));
        [Am1,Lm1] =  max(c1);
        d1 = Lm1 - (length(c1)+1)/2;
        Delay(num,k+3)=d1/Fs;   
    end
    [c2,lags2] = xcorr(y0(:,3),y0(:,4));
    [Am2,Lm2] =  max(c2);
    d2 = Lm2 - (length(c2)+1)/2;
    Delay(num,6)=d2/Fs;   
end

Length = length(y0);
T = 1 / Fs;
t = (1 : Length) * T;
t = t';
figure;
 subplot(411);
plot(t,y0(:,1));
title('mic1');
xlabel('(秒)')
ylabel('幅度(V)')
subplot(412);
plot(t,y0(:,2));
title('mic2');
xlabel('(秒)')
ylabel('幅度(V)')
subplot(413);
plot(t,y0(:,3));
title('mic3');
xlabel('(秒)')
ylabel('幅度(V)')
subplot(414);
plot(t,y0(:,4));
title('mic4');
xlabel('(秒)')
ylabel('幅度(V)')
%%%%%%%%%%%%%%%%%%%%%%%%%%%%
c = 340;
ddd = 0.03;
a1 = c*Delay(1,5);
b1 = sqrt(ddd*ddd - a1 * a1);
a2 = c*Delay(1,2);
b2 = sqrt(ddd*ddd - a2 * a2);
kk = b1*b1*b2*b2 - a1*a1*a2*a2;
mm1 = a1*a1*b2*b2;
mm2 = a2*a2*b1*b1;
nn1 = a2*a2+b1*b1;
nn2 = a1*a1+b2*b2;
ppp = sqrt(mm1*nn1/kk);
qqq = sqrt(mm2*nn2/kk);
if a2 > 0
    yyy = -qqq;
else
    yyy = qqq;
end 
if a1 > 0
    xxx = ppp;
else
    xxx = -ppp;
end
angle = atan(xxx / yyy)*180/pi
% if angle <= 0
%     theta = -angle + 180
% else
%     theta = angle
% end



上述代码可以通过c语言移植到具备算力的开发板中,根据数据集中的按照不同θ角度的麦克风阵列数据,分别进行角度验证,锁定声源的坐标,根据求得的角度在代入R即可求出声源的实际距离。测试结果如下:
360度声源的测试结果
45度声源的测试结果
90度声源的测试结果
120度声源的测试结果
135度声源的测试结果
180度声源的测试结果
225度声源的测试结果
270度声源的测试结果
315度声源的测试结果
可以看出,双曲交汇定位算法是有一定效果的。良好的定位效果和声源距离麦克风阵列的距离、声源所发声信号的类型频率、背景噪声等有关,下一步将继续优化定位算法,使定位结果更加精准。

上述结构四通道麦克风定位数据集下载

链接:https://pan.baidu.com/s/1t63N73ZDFx9Ih6aeBISrRA
提取码:esnp

定位精度时延改进——时域预处理

为了提高数据精度,需要对时域信号进行预处理——立方处理。就是对时域信号的每个点做三次幂处理。

未预处理实验

close all;
clear;
clc;
[time_txt,Fs] = audioread('E:\***\SoClas_database\Segmented_Sound\class06\class06_270\class06_270_001.wav');
LEN = 7361;
x1 = time_txt(:,1);
x2 = time_txt(:,2);
% xxx1 = x1.*x1.*x1;
% xxx2 = x2.*x2.*x2;
xxx1 = x1;
xxx2 = x2;
X1=(fft(xxx1));
X2=(fft(xxx2));
Sxy=X1.*conj(X2);
Bxy=fftshift(abs(ifft(Sxy)));
figure;
subplot(211);
Xxy=xcorr(xxx1,xxx2);
plot(Xxy);
title('DSP hxg')
subplot(212);
plot((Bxy));
title('MATLAB hxg')

在这里插入图片描述

预处理实验

close all;
clear;
clc;
[time_txt,Fs] = audioread('E:\***\SoClas_database\Segmented_Sound\class06\class06_270\class06_270_001.wav');
LEN = 7361;
x1 = time_txt(:,1);
x2 = time_txt(:,2);
xxx1 = x1.*x1.*x1;
xxx2 = x2.*x2.*x2;
X1=(fft(xxx1));
X2=(fft(xxx2));
Sxy=X1.*conj(X2);
Bxy=fftshift(abs(ifft(Sxy)));
figure;
subplot(211);
Xxy=xcorr(xxx1,xxx2);
plot(Xxy);
title('DSP hxg')
subplot(212);
plot((Bxy));
title('MATLAB hxg')

在这里插入图片描述

  • 15
    点赞
  • 222
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
肯塔基大学分布式音频阵列工具箱matlab源码 麦克风阵列是空间分布的麦克风系统,其在感兴趣的区域上相干地收集声学数据。主要应用包括: 声源位置 检测并定位声源,例如说话的人,机器嗡嗡声和来自风障的湍流点。 信噪比增强 通过所有通道上的延迟和求和将所有麦克风聚焦在房间中的特定兴趣点上,从而在感兴趣点处产生相长干涉,并在其他空间产生破坏性(或至少很少建设性)的干扰。位置。 在过去的半个世纪中,已经为阵列处理开发了许多有趣的工作和想法。此工具箱(仍在开发中)是Matlab函数的集合,可用于模拟和处理音频阵列系统收集的数据。这些课程是在肯塔基大学的音频系统实验室开发的。工具箱中程序的贡献者包括: Phil Townsend,ArulKumaran Muthukumarasamy,Satoru Tagawa和Jens Hannemann。 在阵列系统中,相对于麦克风和源的空间几何形状处理信号。因此,除了音频源和接收器的典型时间和频率特征之外,还必须知道位置和空间路径并将其合并到处理中。此工具箱中的Matlab函数具有提供位置信息的矢量和矩阵的标准约定。围绕这些约定开发的函数允许有效地重用,兼容和修改工具箱函数。 以下矩阵和向量约定适用于所有适用的工具箱函数: 与阵列相关联的信号的集合(例如,来自麦克风的数据)以列方式存储在矩阵中,并且行索引对应于随时间采集的样本。较大的行索引对应于更近的时间样本(行索引1是记录的第一个和最旧的样本)。 数组元素(麦克风),源和其他元素在空间中的位置用列向量表示或在矩阵中用列表示,其中每列对应于空间中的对象位置,行对应于x,y和z坐标的位置。如果仅给出2个维度(2行),则算法将在平面(2D)中工作。如果给出一个维度,则算法将沿着一条线工作,这可能适用于诸如端射阵列的校准程序或声音测量速度的应用。 视场(FOV)定义分析或成像的空间限制。FOV限于矩形/立方体尺寸,并且是表示相对角点的坐标的2列矩阵。阵列元素和FOV的坐标必须相对于相同的空间参照系。 上述约定简化了工具箱功能的编程和使用,几乎没有限制。请注意,对数组元素的数量或数组元素的几何形状没有限制。
麦克风阵列声源定位是指通过多个麦克风的接收时间差(TDOA)来确定声源的位置。该算法的基本思想是在特定的时刻同时记录麦克风信号,并计算信号到达不同麦克风的时间差,然后利用三角定位法或其他定位算法计算声源位置。声源定位技术广泛应用于无线通信、音频信号处理、语音识别、语音合成和安防等领域。 为了验证基于TDOA算法麦克风阵列声源定位的可行性和准确性,需要进行仿真实验。仿真实验可以通过模拟麦克风阵列接收声波信号,并计算信号到达时间差来模拟真实环境下的声源定位。在仿真实验中,可以通过控制声源位置、噪声水平和麦克风阵列的几何形状等因素来模拟不同的场景。 基于TDOA算法麦克风阵列声源定位仿真实验需要实现以下步骤: 1. 生成声源信号:通过声波信号发生器生成不同频率和振幅的声源信号。 2. 模拟麦克风阵列接收信号:将声源信号通过声波传播模型模拟成麦克风阵列接收的信号。 3. 计算TDOA:通过信号处理技术计算信号到达不同麦克风的时间差。 4. 声源定位:使用三角定位法或其他定位算法计算声源位置。 5. 分析实验结果:比较仿真实验结果与真实环境下的声源定位结果差异,评估算法的准确性和可靠性。 基于TDOA算法麦克风阵列声源定位算法仿真实验是一个复杂的过程,需要综合运用声学、信号处理、数学和编程等知识。通过实验,可以深入了解声源定位算法的实现原理和应用现状,为真实环境下的声源定位问题提供重要参考。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值