近年来,国内人工智能技术日新月异,但一些前端技术,却少有突破。随着A.I.智能语音等产品的流行,人们的人机交互方式逐渐从物理交互向生物交互转变。而交互的第一步——拾音,效果差强人意。就智能家居来说,它们的拾音范围多集中于近场环境,约为2-3米,且拾取效果往往欠佳,需多次唤醒。
如果把摄像机比作“眼睛”,拾音器便是“耳朵”。眼睛看到的图像和耳朵听到的声音组合构成一个基本的影音记录系统。然而这只灵活的耳朵在应用过程中会受到诸如拾音距离、室内混响、环境噪音等诸多因素的影响,这对拾音来说是不小的挑战。
如何真正“耳听八方”?深耕智能语音与人工智能领域多年的科大讯飞,近期,推出了全新拾音品牌——谛听,在超小音量拾取和降噪方面力争取得一席之地。其实,讯飞在早前推出的讯飞录音笔、智能鼠标、阿尔法蛋等产品均涉及语音交互。基于产品应用的技术积累,这次在拾音领域发力深耕,令人欣喜。
据了解,科大讯飞谛听系列配备了32路麦克风,主打全自动声源定位、自适应波束形成和混响抑制技术以及基于深度学习的噪声抑制和语音自动增益调节算法,可实现室内说话人自动定位、噪声与混响抑制、音量自动调节等功能,从而达到精准拾音的目的。
自动追踪声源,精准拾取30分贝超小音量
近日,某科技博主的一支关于拾音器的评测视频引发关注。视频中,科大讯飞的谛听系列产品和德国森海塞尔、美国舒尔的同类产品“同台竞技”,讯飞表现出彩。
在模拟30分贝人耳都无法听见的超小的音量环境下,