最近在做智能客服的时候需要使用到语音识别,所以了解和对比了各家平台的语音识别对比和分析!
一、科大讯飞
1、语音听写即在线音识别查看Demo
把语音(≤60秒)转换成对应的文字信息,让机器能够“听懂”人类语言,相当于给机器安装上“耳朵”,使其具备“能听”的功能
可以识别多种方言,识别率高
支持Android,iOS,Windows,Java,Linux
2、语音转写即长语音识别查看Demo
语音转写(Long Form ASR)基于深度全序列卷积神经网络,将长段音频(5小时以内)数据转换成文本数据,为信息处理和数据挖掘提供基础
支持标准版/电话专用版,可以单声道&多声道,返回json格式
价格范围为4.9~9.9元/小时,提供5小时免费使用
3、实时语音转写查看Demo
实时语音转写(Real-time ASR)基于深度全序列卷积神经网络框架,通过 WebSocket 协议,建立应用与语言转写核心引擎的长连接,将音频流数据实时转换成文字流数据结果
WebSocket形式输入PCM实时音频流,导出json格式数据
价格为2万元/路/年,新用户免费限时使用。
二、阿里语音识别
阿里云语音识别为智能语音交互2.0,价格有免费和付费版本,免费版本最大并发为10,商务专用版 最大为200/100两个并发,也可以按量付费。参考阿里语音识别报价
电联客服,告知每小时价格为3.5,超过900小时为3块,每条线路分开计时,即100条线路每天打8小时为800小时&#x