苹果专利：利用音频估计设备与说话用户的距离_利用声音确定距离与位置 csdn-CSDN博客

转发引用原网址：https://www.toutiao.com/i6920273752940872206/?tt_from=weixin&utm_campaign=client_share&wxshare_count=1&timestamp=1611283573&app=news_article&utm_source=weixin&utm_medium=toutiao_ios&use_new_style=1&req_id=2021012210461201012904901822295F35&share_token=0F10175D-62D9-419F-91A0-F59DC6CF5580&group_id=6920273752940872206

新专利显示，苹果正在研究HomePod或其他设备如何利用音频来估计与说话用户的距离，还可以识别周围的声音。苹果的HomePod已经很好地听到了你的声音，即使是在大声播放音乐的时候。现在新专利申请显示，苹果希望改进这一点，并将设备的听觉能力，提升到一个新的水平。

一项是名为 "基于学习的距离估计"的专利，涉及到使用音频不仅仅是为了识别用户，而是为了弄清用户的位置。苹果在专利当中表示，设备使用紧凑麦克风阵列估计设备到用户的距离，例如，设备可以根据用户与设备的估计距离来调整播放音量或智能辅助设备的响应。因此，如果用户离设备非常近，音乐或语音将不会以高音量播放，另外，如果用户离得很远，媒体播放或智能助理设备的响应可能会被调整到更大的音量。

这个想法也是为了改进苹果目前令人印象深刻但又有些缺陷的系统，即多个苹果设备都会尝试确定你对哪个设备说了 "嘿，Siri"。对此，苹果在专利当中表示，在有多个设备的应用场景中，设备之间可以相互协调或仲裁，根据每个设备到用户的距离来决定哪一个或多个设备应该回复查询。

在专利当中，苹果提出了简单和更复杂的解决方案，这些方案都可以协同使用。比较简单的是让设备像HomePod（内置Siri智能音箱，搭载6个麦克风阵列，4英寸低音炮，底部配有7个扬声器阵列）一样，先绘制出环境图（这个根据麦克风与扬声器的相对位置关系，构建声音传播的网络）。然后，它有效地拥有一个声学环境中的测量或模拟点的网格。在这种情况下，就可以将声音与这个 "网格 "进行对比，从而大致判断出说话的人所在的位置。

如果这不够好，苹果还有另一个解决方案，它涉及 "基于学习的系统，如深度神经网络（DNN），而且不需要多个设备互相协调帮助。苹果在专利当中表示，深度学习系统可以根据紧凑的麦克风阵列接收到的语音信号，估计语音源在每个时间段的距离。这个DNN系统可以做的是确定什么是语音，什么是背景噪声（语音与噪声分离）。然后，它可以计算出关于直接信号传播的信息，还可以计算出混响效应和噪声。