AI语音之“一句话识别 ”调研分析

背景

此次物联网项目中需要使用语音来控制设备,特意对语音这一部分进行了调研
提取出了一个关键词- 一句话识别
在此对其进行解释与分析

名词解释 一句话识别

把语音(≤60秒)转换成对应的文字信息,适用于较短的语音交互场景,如语音搜索、语音输入、语音控制等。

语音供应商

  • 云知声
  • 科大讯飞
  • 思必驰
  • 北京声智
  • 上海声翰
  • 阿里
  • 百度
  • 蓦然
  • 腾讯

分析

云知声

提供的典型应用场景
在这里插入图片描述分析 : 目前没有android sdk, 按次计费
在这里插入图片描述科大讯飞

讯飞提供的为语音听写

  • 语音听写,是基于自然语言处理,将自然语言音频转换为文本输出的技术。语音听写技术与语法识别技术的不同在于,语音听写不需要基于某个具体的语法文件,其识别范围是整个语种内的词条。

将短音频(≤60秒)精准识别成文字,除中文普通话和英文外,支持35个语种、24种方言和1个民族语言,实时返回结果,达到边说边返回的效果,可提供公有云接口及私有化部署方案
应用场景:
在这里插入图片描述分析: 按次收费 ,开发者资源丰富
Android SDK

思必驰
提供的为 语音识别

思必驰提供基于云+端混合引擎的连续语音识别,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。
应用场景:
在这里插入图片描述分析: 需要商务联系 无公开sdk

北京声智

提供的为 离线命令词识别
支持无网络连接情况下识别常用指令

产品介绍:

将语音识别模块的部分功能移植到本地设备中,用户对设备(手机、玩具、家电等)说出操作指令(即“命令词”),设备即作出相应的反馈,开启语音交互,一定程度上摆脱网络依赖,让识别更便捷、高效

应用场景:
在这里插入图片描述分析: 需要商务联系 无公开sdk

上海声翰
提供的是智能机器人语音交互解决方案
在这里插入图片描述
分析: 需要商务联系 无公开sdk 不确定是否可以拆分
阿里
智能语音交互:
智能语音交互(Intelligent Speech Interaction),是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融、保险、司法、电商等多个领域均有应用案例。

一句话识别

  • 对一分钟内的短语音进行识别,适用于对话聊天、控制口令、语音输入法、语音搜索等较短的语音识别场景
    阿里提供一句话识别的 sdk
    Android SDK
    百度
    百度提供 短语音识别标准版
    将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景
    应用场景:
    在这里插入图片描述分析:百度提供短语音识别SDK
    Android SDK

腾讯
腾讯提供的是云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。
分析: 腾讯提供sdk
SDK 获取

一句话识别 Android SDK 及 Demo 下载地址:Android SDK
蓦然公知
蓦然提供了一个 酒店AI助理方案的方案
在这里插入图片描述

分析: 需要商务联系 无公开sdk,不确定是否支持小功能开发

总结

一句话识别 是在物联网中应用最广 最有效的语音解决方案 以上各厂都有开发 按需使用
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值