语音识别 干扰抑制_声加科技:低功耗语音本地唤醒 + 双麦 SVE 降噪技术方案,助力 TWS 耳机智能化...

随着TWS耳机的普及,语音识别成为提升用户体验的重要途径。声加科技提供了低功耗的关键词唤醒(KWS)方案,通过与手机语音助手配合,实现快速响应的有限语音命令操作。同时,双麦SVE降噪技术能有效抑制环境噪声,提高通话质量和语音识别准确性,已在多个品牌耳机中得到应用。
摘要由CSDN通过智能技术生成

942dc9753c91dc1bbb2093ca1ee0743c.png

耳机搭载语音助手已经成为目前 TWS 耳机的主流趋势,但目前市面上绝大部分产品使用的还是以基于手机的语音识别方案,用户每一次的语音指令都要首先唤醒手机语音助手,造成响应速度较慢(切换歌曲需要等待5~6秒),不少用户因此放弃了语音唤醒功能,宁可使用手势或按键,甚至只能拿出手机进行操作,体验欠佳。

这主要受限于耳机运算能力较弱以及电池续航时间短,给耳机端进行精确的语音识别造成了极高难度。

关键词唤醒(KWS)有限语音命令方案

声加科技的关键词唤醒(KWS)有限语音命令方案,可实现唤醒低功耗计算方案,KWS 启动和手机语音交互,有限语音命令实现切歌、调音量等基本操作。在算法所需资源消耗上,低至 30Mips, 50KBytes memory 的唤醒词模型(m4f 平台),模型规模可变,能根据产品计算资源快速调整模型,还能整合声加自有前端语音增强,优化整体性能。

双麦 SVE 降噪技术方案

SVE(Soundplus Voice Enhancement)降噪技术可以广泛应用于耳塞式耳机、半入耳式耳机、入耳式耳机、头戴式耳机、挂耳式耳机等,是通过双麦克风阵列,精准计算通话者说话的方位,在保护主方向目标语音的同时,去除环境中的各种干扰噪声,例如其他人的讲话声、交通工具产生的噪音、风噪声等等,有效抑制 90% 的反向环境噪声,由此降低环境噪声最高可达 30dB,保证高品质通话效果。

其核心技术包括:

  • 回声消除 AEC:支持单通道回声抵消、双通道立体声回声抵消,可在设备自身播放大音量时轻松唤醒,ERLE>30dB。
  • 声源定位 Direction of arrival estimation:支持多源定位,以及在强混响及噪声干扰情况下准确定位目标声源;
  • 定向拾音、环境降噪(尤其是风噪抑制):能有效降低通话时的环境噪声,即使身处嘈杂环境,也能保障高清晰的语音识别以及通话质量。耳机使用场景复杂且运算资源受限,如果只依靠基于深度学习的小资源语音识别模型,在嘈杂环境下会存在误识率高、识别率低的问题。

目前,声加科技的耳机技术方案已应用在了华为 Flypods、小米 Air、小米 Air2、万魔 EM001、万魔 EM004、京东京鱼座等产品上。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值