语音识别哪家强 讯飞 搜狗 百度 阿里还是腾讯

识别结果对比如下:http://download.csdn.net/download/elesos/10138377

百度


REST API
格式:推荐pcm
推荐16K
编码:16bit 位深的 声道
最长支持60s的录音文件


http://ai.baidu.com/docs#/Auth/top AipSpeech.php的使用方法

tts:语音合成

如果不使用raw方式,而是使用json方式:
(speech, len) 及 (url, callback) 这两组参数必须二选一

异步的返回值
{"err_msg":"success. ","err_no":0,"sn":"396863495271511838506"}
异步的结果会返回到一个回调地址里,需要将数据存储才能看到
这个很慢,且不稳定




搜狗的

SDK适用于Android和iOS平台




讯飞的,可以在线测试

腾讯 的
还在申请中


阿里的
提供如下三种服务:
「 一句话识别 」对一分钟内的短语音实时识别,适用于对话聊天,控制口令等较短的语音识别场景。
「 实时语音识别 」:对长时间的语音数据流实时识别,适用于会议演讲、视频直播等长时间不间断识别的场景。
「 录音文件识别 」:对录音文件中的语音做识别,需要存放到oss上,并 设置数据为私有, 非实时
oss为 私有的情况下oss地址还要包含Signature,Expires,OSSAccessKeyId三个参数

阿里云大数据平台,简称数加

采样率要求是8或16K

阿里内部进行了切分,返回的结果也是分段的,后面一段重复识别了前面一段的后15ms


总结:
百度的要求格式是16K,单声道的pcm,而且时长不超过60s, 免费,但是有 50000次/日  的在线识别调用配额,可以申请提高配额。

测试demo(支持各种格式音频输入,内部会进行转换):有需要的私信


搜狗的目前 只有 Android和iOS平台适用,未测试

讯飞的,可以在线测试
每小时9.9元

腾讯 的
还在申请中

阿里的

提供如下三种服务:
「 一句话识别 」对一分钟内的短语音实时识别,适用于对话聊天,控制口令等较短的语音识别场景。
「 实时语音识别 」:对长时间的语音数据流实时识别,适用于会议演讲、视频直播等长时间不间断识别的场景。
「 录音文件识别 」:对录音文件中的语音做识别,需要存放到oss上,并 设置数据为私有, 非实时

测试demo地址:有需要的私信
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值