技术发展杂谈(三)——双麦阵列、六麦阵列与七麦阵列

总述

首先从麦克风阵列技术本身来看,麦克风阵列是指应用于语音处理的按一定规则排列的多个麦克风系统,也可以简单理解为2个以上麦克风组成的录音系统。麦克风阵列一般来说有线形、环形和球形之分,严谨的应该说成一字、十字、双L、平面、螺旋、球形等。

1、麦克风阵列技术
首先从麦克风阵列技术本身来看,麦克风阵列是指应用于语音处理的按一定规则排列的多个麦克风系统,也可以简单理解为2个以上麦克风组成的录音系统。麦克风阵列一般来说有线形、环形和球形之分,严谨的应该说成一字、十字、双L、平面、螺旋、球形等。
至于麦克风阵列的阵元数量,也就是麦克风数量,可以从2个到上千个不等。由于成本限制,消费级麦克风阵列的阵元数量一般不超过8个,所以市面上最常见的就是6麦和4麦的阵型。
2、麦克风的质量、数量及布局
除了算法,决定麦克风阵列性能的主要就是阵元麦克风的质量、数量及布局。这些基本都是硬件架构所决定,特别是麦克风的质量和数量,又与每个厂商的供应链紧密相关,这就非常容易造成每款产品的差异。比如叮咚1代为保证性能,选择了性能指标更高的指向型驻极体麦克风,而Amazon Echo则为了保证量产质量,则选用了性能指标较低的MEMS麦克风。由于算法的持续提升,对于麦克风的要求不再严格,因此MEMS麦克风是当前主流的应用。
3、远场语音交互的场景
其次从远场语音交互的场景来看,比如智能音箱、智能中控和智能汽车的场景肯定不一样,其需求自然也不同。智能音箱一般都是放置桌面,需要360度响应指令,所以环形阵列比较适合,而智能中控一般贴墙固定,仅照顾180度范围即可,这时候线形阵列就能满足。


1.双麦阵列设计参考(Google Home采用)

双麦阵列构型

图1-1 双麦线性阵列构型

如图1-1所示,麦克风按直线摆放,间距为80mm。

原理:

麦克风降噪技术是大规模应用的最普遍的降噪技术,一个麦克风为普通的用户通话时使用的麦克风,用于收集人声,而另一个配置在机身顶端的麦克风, 具备背景噪声采集功能,方便采集周围环境噪音。

手机设有A、B两个性能相同的电容式麦克风,其中A是主话筒,用于拾取通话的语音,话筒B是背景声拾音话筒,它通常安装在手机话筒的背面,并且远离A话筒,两个话筒在内部有主板隔离。正常语音通话时,嘴巴靠近话筒A,它产生较大的音频信号Va,与此同时,话筒B多多少少也会得到一些语音信号Vb,但它要比A小得多,这两个信号输入话筒处理器,其输入端是个差分放大器,也就是把两路信号相减后再放大,于是得到的信号是Vm=Va-Vb。 如果在使用环境中有背景噪音,因为音源是远离手机的,所以到达手机的两个话筒时声波的强度几乎是一样的,也就是Va≈Vb,于是对于背景噪音,两个话筒虽然是都拾取了,但Vm=Va-Vb≈0 从上面的分析可以看出,这样的设计可以有效地抵御手机周边的环境噪声干扰,大大提高正常通话的清晰度。

双麦阵列波束形成

双麦克风阵列在0°~180°范围内形成3个波束,每个波束对应60°的录音范围,如下图1-2所示。

图1-2 双麦线性阵列波束形成


2.六麦克风阵列设计参考(下文转自科大讯飞技术文档

环形6麦是被各大厂商使用最广泛的麦克风阵列设计方案,这种方案同时也兼顾了成本和远场语音交互性能。国内小米AI音箱采用声智科技的前端方案,其中的阵型就是环形6麦,同时为继续降低成本,麦克风也全部采用数字麦克风,这样就省掉了模拟麦克风必须搭配的AD芯片。国内采用这个阵型的还有天猫精灵、小雅音箱,然而,不同于小米AI音箱,天猫精灵为照顾算法因素,依然采用了模拟麦克风+TI ADC的方案。

六麦阵列构型

图2-1 六麦环形阵列构型

图2-2 六麦环形阵列构型

六麦环形阵列呈圆形布局,其中6个麦克风均匀分布在圆周,麦克风按圆形等距摆放,半径为35mm,如图2-1所示。

圆平面和水平面之间可以有一定夹角,但夹角不能超过10°(图2-2)。

麦克风阵列的零度方向必须和产品的正面朝向保持一致。

六麦阵列波束形成

六麦克风阵列形成6个波束,每个波束对应60°的录音范围,如图2-3所示。

图2-3 六麦环形阵列波束形成

麦克风选型参考

全向麦克风,大口径,高灵敏度。

测试条件:Vs=2.0V;RL=2.2kΩ;BW=100Hz~20kHz;Ta=20+/-2℃。

表3-1 麦克风选型参考

麦克风阵列结构设计建议

设计总体要求

(1) 人声能直达每个麦克,避免掩蔽效应,即产品正常使用场景下,保证声源的直达声(非反射声)到达每个麦克的机会是均等的,举例,麦克风震膜背对人的嘴巴就可能会形成掩蔽效应;

(2) 声音到达麦克风的路径尽可能短、宽,要求谐振点频率在8KHz以上。对于紧贴面壳安装方式,如图4-1所示要求声孔的深度(面壳进声孔外侧到MIC进声孔外侧的距离)小于1.5mm,声孔直径尽可能大(最小2mm)。如果麦克能直接在表面最好,如图4-2所示;

图4-1 麦克紧贴面壳安装基本要求

图4-2 麦克安装在表面

(3) 声音路径内不要存在任何空腔,对于紧贴面壳安装方式,震膜和壳体内壁不要有缝隙,不允许出现如图4-3的安装方式;

图4-3 震膜和壳体存在腔体(避免)

(4) 麦克风要远离干扰或震动(喇叭震动、结构转动震动)。对于震动,一般采用硅胶套进行减震密封处理,硅胶软硬度可根据实际结构形式进行匹配验证,一般要求尽可能软;

(5) 喇叭的失真要小,100Hz-1kHz失真要小于10%,1kHz之后小于5%。一般喇叭在低频部分失真会较高,超过10%,建议加滤波器滤除低频成份;

(6) 喇叭的结构设计要避免结构引发的失真,喇叭要进行减震处理,避免结构震动对麦克造成较大影响;

(7) 喇叭腔体四周与其它机构件至少保留1mm的间距,振膜上方与机构件至少保留1.5mm的间隙,防止喇叭碰到结构件产生振动和异音;

(8) 避免结构内声音传播,即喇叭的声音不能在结构内泄露到麦克,只能通过结构外的空气传播到麦克,建议喇叭和麦克风放在不同腔体内或选用性能好的密封材料对腔体内麦克部分进行密封;

图4-4 避免结构内声音泄露示意图

(9) 对于驻极体麦克风,结构设计和生产过程中要考虑对麦克风的保护,避免挤压引发的麦克风一致性损失。

麦克风结构设计方案

根据产品结构型式和产品需求,麦克风阵列的结构设计建议使用面壳安装方式,其结构设计要求和建议参照下述方案说明。

面壳安装方式方案

该结构方案麦克风阵列和硅胶套装配后固定于面壳上,通过面壳上的拾音孔进行录音采集。

a) 示意图

图4-5 面壳安装方式声腔结构示意图

图4-6 单个麦克风声腔设计示意图

b) 设计说明

(1) 麦克风之间严格独立,每个麦克风的拾音孔是其唯一的进声孔,如图4-5所示。

  一种验证方法:用手按住麦克风的拾音孔,拾音音量降低不小于20dB。

(2) 麦克风需要有橡胶套和固体表面隔绝,起到降低壳体震动传声以及密封的作用(图4-6绿色结构)。

(3) 麦克风距离外表面的距离(拾音孔深度)要尽可能的小(一般要求小于1.5mm),声孔直接尽可能大(一般要求大于2mm),防止声音在拾音孔内壁的反射形成谐振点。

(4) 根据应用场景情况,可在麦克风表面增加防风棉(类似车载空调风直吹场景)和防尘棉等零件。

功放增益设计参考

喇叭和麦克风距离尽量远,喇叭到麦克风的声压不超过90分贝(在麦克风处测得),人声音量和喇叭音量强度信噪比不低于-25dB(人声到麦克风的声压约65分贝)。

建议调试步骤:

(1) 在喇叭最大播音音量下,确保麦克录音不截幅。

(2) 在喇叭最大播音音量时,距离麦克3~5米进行唤醒测试(超过3米人声需要适当提高),如果不能正常唤醒,则需调小功放增益,直到能正常唤醒为止。

其他“6+1”“6+2”型阵列

Amazon Echo采用典型的6+1麦克风阵列结构,即环形6个麦克风搭配中间1个麦克风,如下图左所示。


七麦阵列

(这里做简要介绍)

科大讯飞的叮咚音箱系列产品都是模仿的这种结构,讯飞增加了1个麦克风,形成了环形7+1麦克风阵列的结构,如下图所示。叮咚1代和2代的差别主要是1代采用的是驻极体麦克风,而2代换成了模拟的MEMS麦克风。


其他类型阵列

Amazon Echo Show则采用了椭圆形麦克风阵列,国内一般也称为跑道形,其实就是双线形,如下图左所示。这个阵型因为Echo Show的厚度问题所做了折衷处理,也是典型的技术妥协于产品设计的案例。目前,国内只有声智科技供应类似阵型,即L型6麦阵列,见如下图右所示。

Amazon Echo Spot进一步缩减了麦克风阵列的配置,采用了环形4麦的技术,如下图左所示,这个阵型既降低了成本但也保证了一定的效果,这是比较典型的根据场景选择合适技术的案例。

参考文章:

1.亚马逊Echo新品技术解读,如何选择合适的麦克风阵列?

2.双麦阵列设计参考 | 讯飞开放平台文档中心

  • 5
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值