远场语音是什么鬼?和人工智能有什么关系?

语音交互被视为用户在未来很多场景下的主要流量入口之一,因此,寻求可靠有效的远场语音技术突破变成了当下的需求;一个经典的语音识别系统包含麦克风信号采集模块、信号处理模块以及语音识别模块,每个模块的处理方法都会影响最终的识别效果。

WVWMoWYTWmGxyMUokLWfow.jpg

智能远场语音是融合了AI语音搜索的一项改变用户体验的功能,用过蓝牙语音遥控器的玩家都知道,当我们要发出语音指令需要按下遥控器的语音按键,对着遥控器说出指令,才能让智能电视或者智能盒子做出反应,而智能远场语音功能则是省略了按下遥控语音键这一程序,你只需要坐在沙发上说出指令,即可得到反馈。

w58XXHpEAeKx-KGtyM2zDA.jpg

远场语音识别主要面临着回声干扰、室内混响、多信号源干扰以及非平稳噪声的干扰等;针对回声干扰问题,需采取回声消除技术,将设备自身播放的声音从麦克风接收到的信号中除去。

158457898206025221.jpg

房间混响是远场语音识别特有的问题。房间混响会造成麦克风接收到的信号有很长的拖尾,让人听起来感觉发闷。在实际中,人耳具有自动解混响的能力,在实际房间中相互交流并没有影响反而觉得声音饱满。

158457898209964086.jpg

相对于近场语音识别来说,远场识别所面临的挑战主要是由复杂的信号传播环境引起的。因此,对于语音信号研究者来说,非常基础且重要的工作是对声音传播环境进行精准的建模。

J_trmbyImuoNMRJuPJMUIw.jpg

这个模型不光有助于我们认识信号衰减特性,能够设计出具有针对性的语音信号增强算法。而且,还可以借助这个模型,快速生成大量的远场语音数据用于识别端的声学模型训练,有助于解决远场语音数据难采集难的问题。

158451992015229708.jpg

远场语音识别需要前后端结合去完成,一方面在前端使用麦克风阵列硬件,通过声源定位及自适应波束形成做语音增强,在前端完成远场拾音,并解决噪声、混响、回声等带来的影响。结合人工智能算法,也就是后台识别引擎,通过软硬件的复杂结合,让远场语音实现自然人机交互,让用户远距离即可实现与智能电视或者智能盒子进行“对话”。

aWObJY76t_7W37r1bts6MA.jpg

创维推出的这款电视,通过百度智能音箱连接实现远场语音操作,它还采用4K,HDR对比度提升技术,画面清晰可见,是一款值得入手的语音电视。

158451986938089671.jpg

创维电视55E33A

¥

¥

去购买

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值