语智科技远场语音识别FFASR开发者平台上线丨为万物赋能远场语音交互

最新推荐文章于 2021-08-27 14:37:55 发布

AnnieJohnson

最新推荐文章于 2021-08-27 14:37:55 发布

阅读量351

点赞数

文章标签：人工智能算法语音识别 asr api 开发者

语智科技FFASR远场语音识别开发者平台即日上线
登陆语智科技官网，调用API即可免费接入：www.yuzhix.com

什么是FFASR？

语智科技FFASR(Far-Field Automatic Speech Recognition) 是专门针对于远场语音交互开发的识别引擎，使远场交互不再局限于麦克风阵列，使任意麦克风采集的音频亦可接入云端识别引擎，获得语音识别结果。

图片描述

FFASR与传统ASR有什么区别？

图片描述

FFASR有哪些特点？

图片描述

为什么FFASR拥有领先15%的卓越性能？

在FFASR远场语音识别引擎上实现这一优异的性能表现，是基于语智科技对远场语音识别的技术链条上每个环节有着学术积累和深刻理解，以及在远场降噪、Deep Learning、声学模型、语言模型等多个领域拥有的技术积累和整合能力。

具体来说，由于FFASR远场识别引擎是通过算法进行声学降噪处理，因此对声学降噪需要解决的三个干扰问题——噪声、混响、干涉进行了精确的数学建模，这同时对处理声学降噪的神经网络提出了更高的设计要求。为了能够同时处理前端声学降噪和语音识别，语智科技FFASR算法将CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)进行了深度整合，搭建了更复杂的深度学习网络，并将网络分成很多部分，用以处理不同的任务。而这样的神经网络还需要更适配和先进的训练平台，语智科技独立设计了的训练平台，替代通常使用的Kaldi ASR进行网络结构训练。

哪些人群适合使用FFASR？

1.手机厂商
2.IoT设备厂商
3.想拥有远场语音交互能力又不想/能使用麦克风阵列的人
4.Geeks

即刻接入FFASR远场语音开发者平台，是时候，让远场语音交互真正来临.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。