目录
引言:
麦克风阵列和其对应的波束形成算法,是远场语音交互中前端处理的核心部分。(SNR较低)经典的场景如多人说话的嘈杂场景称为鸡尾酒会效应。
解决鸡尾酒会问题:
方案1: BSS.
利用单通道算法解决鸡尾酒会问题属于盲源分离问题(BSS,Blind Source Seperation),目标是从多个混合的信号中提取目标信号。盲源分离问题从独立元分析(ICA)发展到如今使用神经网络,但效果仍然不佳。
方案2:利用麦克风阵列。
利用麦克风阵列能获取空间信息,通过空间滤波对信号实现定向增强。 波束形成方法就是一种典型的空间滤波。 并且定向增强能抑制语音反射,起到减轻混响作用。
一. 麦克风阵列概述
麦克风阵列定义:多个按照一定规则排列的麦克风。最常用的阵型包括线性、环形和矩形等。
环形阵列:适用于平面360度收音,可以区分水平与垂直角度。比如圆柱形音箱。
线性阵列:平面180度收音,但无法区分水平和垂直角度。比如微软Kinect等游戏设备,智能交互大屏。
矩形阵列:可以区分水平和垂直角度。