苹果专利:利用音频估计设备与说话用户的距离

转发引用原网址:https://www.toutiao.com/i6920273752940872206/?tt_from=weixin&utm_campaign=client_share&wxshare_count=1&timestamp=1611283573&app=news_article&utm_source=weixin&utm_medium=toutiao_ios&use_new_style=1&req_id=2021012210461201012904901822295F35&share_token=0F10175D-62D9-419F-91A0-F59DC6CF5580&group_id=6920273752940872206

新专利显示,苹果正在研究HomePod或其他设备如何利用音频来估计与说话用户的距离,还可以识别周围的声音。苹果的HomePod已经很好地听到了你的声音,即使是在大声播放音乐的时候。现在新专利申请显示,苹果希望改进这一点,并将设备的听觉能力,提升到一个新的水平。

一项是名为 "基于学习的距离估计"的专利,涉及到使用音频不仅仅是为了识别用户,而是为了弄清用户的位置。苹果在专利当中表示,设备使用紧凑麦克风阵列估计设备到用户的距离,例如,设备可以根据用户与设备的估计距离来调整播放音量或智能辅助设备的响应。因此,如果用户离设备非常近,音乐或语音将不会以高音量播放,另外,如果用户离得很远,媒体播放或智能助理设备的响应可能会被调整到更大的音量。

这个想法也是为了改进苹果目前令人印象深刻但又有些缺陷的系统,即多个苹果设备都会尝试确定你对哪个设备说了 "嘿,Siri"。对此,苹果在专利当中表示,在有多个设备的应用场景中,设备之间可以相互协调或仲裁,根据每个设备到用户的距离来决定哪一个或多个设备应该回复查询。

在专利当中,苹果提出了简单和更复杂的解决方案,这些方案都可以协同使用。比较简单的是让设备像HomePod(内置Siri智能音箱,搭载6个麦克风阵列,4英寸低音炮,底部配有7个扬声器阵列)一样,先绘制出环境图(这个根据麦克风与扬声器的相对位置关系,构建声音传播的网络)。然后,它有效地拥有一个声学环境中的测量或模拟点的网格。在这种情况下,就可以将声音与这个 "网格 "进行对比,从而大致判断出说话的人所在的位置。

如果这不够好,苹果还有另一个解决方案,它涉及 "基于学习的系统,如深度神经网络(DNN),而且不需要多个设备互相协调帮助。苹果在专利当中表示,深度学习系统可以根据紧凑的麦克风阵列接收到的语音信号,估计语音源在每个时间段的距离。这个DNN系统可以做的是确定什么是语音,什么是背景噪声(语音与噪声分离)。然后,它可以计算出关于直接信号传播的信息,还可以计算出混响效应和噪声。

上述这个专利非常有意思,并且能够解决实际生活中遇到的问题。这是利用声音,是否还可以使用其它技术或媒介能够达到同样的效果,值得我们思考。

好多有趣有价值的研究来源于生活中的应用需求,在科研的过程中,要多观察生活中遇到各类小问题。或许某个灵机一动促动新的研究成果。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值