微信小程序语音识别探索
背景:最近在做一个旅游相关的工程,其中有微信小程序模块,需求方希望我们在小程序加上语音识别景点的功能,可是小程序并没有支持这个功能,所以小程序的同学就扔给我这个安卓端的来做(笑)
参考资料:
1.http://www.jianshu.com/p/b092da81feb0 本文可以说是在这篇文章的基础上完成的,但一开始遇到了很大的困难(涉及到一个坑下文会提及),学过node.js的同学应该可以做到即插即用,但是本工程使用的是javaweb完成的,还是衷心感谢下作者,虽然不回我私信
2.https://github.com/kn007/silk-v3-decoder 将silk v3转化成wav使用的库,作者十分热心
为了帮助像我这样比较着急完成工程的同学,这次探索过程的苦水我就不倒了,简单粗暴上结果:
在使用微信web开发工具进行调试和真机上使用的时候,录音文件保存的格式是不一样的,本文以这个为分水岭进行介绍:
1.微信web开发者工具(0.18.182200)
总体处理流程(简述):
本地录音储存文件格式:webm类型的base64字符串
开头指明格式,随后是base64字符串
这里我的处理方法是:
1.忽略前面的类型说明,读入base64字符串
//将微信中的webm格式的base64字符提取出来
BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(file)));
StringBuilder sb = new StringBuilder("");
String temp;
while((temp=reader.readLine())!=null)
{
sb.append(temp);
}
reader.close();
temp = sb.toString();
int index = temp.indexOf("base64,");
temp = temp.substring(index+7);
System.out.println(temp.substring(0,3));
byte