背景
此次物联网项目中需要使用语音来控制设备,特意对语音这一部分进行了调研
提取出了一个关键词- 一句话识别
在此对其进行解释与分析
名词解释 一句话识别
把语音(≤60秒)转换成对应的文字信息,适用于较短的语音交互场景,如语音搜索、语音输入、语音控制等。
语音供应商
- 云知声
- 科大讯飞
- 思必驰
- 北京声智
- 上海声翰
- 阿里
- 百度
- 蓦然
- 腾讯
分析
提供的典型应用场景
分析 : 目前没有android sdk, 按次计费
科大讯飞
讯飞提供的为语音听写
- 语音听写,是基于自然语言处理,将自然语言音频转换为文本输出的技术。语音听写技术与语法识别技术的不同在于,语音听写不需要基于某个具体的语法文件,其识别范围是整个语种内的词条。
将短音频(≤60秒)精准识别成文字,除中文普通话和英文外,支持35个语种、24种方言和1个民族语言,实时返回结果,达到边说边返回的效果,可提供公有云接口及私有化部署方案
应用场景:
分析: 按次收费 ,开发者资源丰富
Android SDK
思必驰
提供的为 语音识别
思必驰提供基于云+端混合引擎的连续语音识别,覆盖中文、英文、葡萄牙语等语种,粤、川、沪等方言,以及带方言的普通话。
应用场景:
分析: 需要商务联系 无公开sdk
提供的为 离线命令词识别
支持无网络连接情况下识别常用指令
产品介绍:
将语音识别模块的部分功能移植到本地设备中,用户对设备(手机、玩具、家电等)说出操作指令(即“命令词”),设备即作出相应的反馈,开启语音交互,一定程度上摆脱网络依赖,让识别更便捷、高效
应用场景:
分析: 需要商务联系 无公开sdk
上海声翰
提供的是智能机器人语音交互解决方案
分析: 需要商务联系 无公开sdk 不确定是否可以拆分
阿里
智能语音交互:
智能语音交互(Intelligent Speech Interaction),是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等场景,在金融、保险、司法、电商等多个领域均有应用案例。
一句话识别
- 对一分钟内的短语音进行识别,适用于对话聊天、控制口令、语音输入法、语音搜索等较短的语音识别场景
阿里提供一句话识别的 sdk
Android SDK
百度
百度提供 短语音识别标准版
将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景
应用场景:
分析:百度提供短语音识别SDK
Android SDK
腾讯
腾讯提供的是云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。
分析: 腾讯提供sdk
SDK 获取
一句话识别 Android SDK 及 Demo 下载地址:Android SDK
蓦然公知
蓦然提供了一个 酒店AI助理方案的方案
分析: 需要商务联系 无公开sdk,不确定是否支持小功能开发
总结
一句话识别 是在物联网中应用最广 最有效的语音解决方案 以上各厂都有开发 按需使用