语智科技远场语音识别FFASR开发者平台上线丨为万物赋能远场语音交互

语智科技FFASR远场语音识别开发者平台即日上线
登陆语智科技官网,调用API即可免费接入:www.yuzhix.com

什么是FFASR?

语智科技FFASR(Far-Field Automatic Speech Recognition) 是专门针对于远场语音交互开发的识别引擎,使远场交互不再局限于麦克风阵列,使任意麦克风采集的音频亦可接入云端识别引擎,获得语音识别结果。

图片描述

FFASR与传统ASR有什么区别?

图片描述

FFASR有哪些特点?

图片描述

为什么FFASR拥有领先15%的卓越性能?

在FFASR远场语音识别引擎上实现这一优异的性能表现,是基于语智科技对远场语音识别的技术链条上每个环节有着学术积累和深刻理解,以及在远场降噪、Deep Learning、声学模型、语言模型等多个领域拥有的技术积累和整合能力。

具体来说,由于FFASR远场识别引擎是通过算法进行声学降噪处理,因此对声学降噪需要解决的三个干扰问题——噪声、混响、干涉进行了精确的数学建模,这同时对处理声学降噪的神经网络提出了更高的设计要求。为了能够同时处理前端声学降噪和语音识别,语智科技FFASR算法将CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)进行了深度整合,搭建了更复杂的深度学习网络,并将网络分成很多部分,用以处理不同的任务。而这样的神经网络还需要更适配和先进的训练平台,语智科技独立设计了的训练平台,替代通常使用的Kaldi ASR进行网络结构训练。

哪些人群适合使用FFASR?

1.手机厂商
2.IoT设备厂商
3.想拥有远场语音交互能力又不想/能使用麦克风阵列的人
4.Geeks

即刻接入FFASR远场语音开发者平台,是时候,让远场语音交互真正来临.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值