高大上吧,大家都习惯了用微信聊天发语音对话和语音转文字功能,这不就是耳聋和盲人对话的核心技术么,今天我们用百度技术带大家也实现这种功能,直接语音转文字、文字转语音的功能,实现一个自己的聊天工具,门槛就是这么低。下面介绍这两种实现的核心技术:
一、语音转文字的功能——百度语音识别
1.介绍
利用百度语音识别API,可以轻松实现语音转文字的功能。这里可以用手机采集一段录音,语音的采集是用一些参数要求的,这里以APIStore上“语音识别”的API进行一些介绍:
首先,接口地址:
http://APIs.baidu.com/APIstore/vop/baiduvopjson ,采用post请求方式;
其次,参数,放在请求的body里,介绍如下:
1) audioBase64:语音文件base64后的字符串,并且要求是urlencode进行转码的;
2) format:支持的格式,压缩格式。支持:pcm(不压缩)、wav、opus、speex、amr、x-flac;
3) rate:采样率,支持 8000 或者 16000;
4) channel:声道数,1:单声道 ;2:双通道;
5) lan:支持语言种类:中文(zh)、粤语(ct)、英文(en);
当然,还有一个apikey的参数,用户用户访问该API的唯一认证凭证,放在请求的header里。
2
.代码实现:
1
)首先我们要制作一段录音。