快商通李稀敏:近场声纹识别将普及,本地化的AI能力是刚需

李稀敏博士在Kaldi交流会上探讨人机语音交互,指出声纹识别能改进交互体验,尤其是在耳机等可穿戴设备中。本地端离线语音技术被认为是未来趋势,因能保障用户隐私并解决近场识别问题。同时,快商通在声纹识别技术上取得进展,能有效防御录音重放攻击。
摘要由CSDN通过智能技术生成

10月26日,第四届Kaldi线下交流会在北京·小米科技园举行。

 

李稀敏博士在以“人机语音交互是否必须要先唤醒和离线语音技术在本地端上的实现是否未来的趋势”为题的圆桌讨论。与猎户星空&Kaldi群主吴本谷、小米智能科技的语音负责人王育军、知存科技CEO王绍迪共同探讨了人机语音交互前沿趋势。

以下为李稀敏博士的精彩分享:

01.人机交互必须要先唤醒吗?

语音交互流程被划分为五个环节 – 唤醒、响应、输入、理解、反馈。其中唤醒是每一次用户与语音产品交互的第一个接触点,唤醒环节的体验在整个语音交互流程中至关重要,它的体验好坏将直接影响用户对产品的“第一印象”。就目前市面上常见的语音交互产品来说,一个眼神或者一个动作还不能引起它的注意,因此需要定义一个将产品从待机状态切换到工作状态的词语,即所谓的“唤醒词”。比如“小度小度”“若琪”“叮咚叮咚”。那么,人机交互我们必须要先唤醒吗?

李稀敏认为:随着技术场景越来越成熟,当机器具备足够的智能化,机器是可以不需要唤醒词,就像跟人对话一样自然。但距离无唤醒交互的实现,还有一段路要走。

从声纹识别的角度来看有两种场景,第一种,用唤醒词作为命令词,设备在休眠或锁屏状态下也能检测到用户的声音(设定的语音指令,即唤醒词),让处于

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值