微信小程序语音识别探索

最新推荐文章于 2024-04-23 02:48:21 发布

GZoom

最新推荐文章于 2024-04-23 02:48:21 发布

阅读量1.1k

点赞数

分类专栏： Android

本文链接：https://blog.csdn.net/get_zoom/article/details/77874397

版权

本文介绍了在微信小程序中实现语音识别的过程，包括处理不同环境下的录音文件格式，如webm转wav和silk-v3转wav。通过ffmpeg进行格式转换，并使用百度语音识别API获取结果。同时分享了遇到的问题，如ffmpeg版本问题和命令路径问题，为开发者提供参考。

摘要由CSDN通过智能技术生成

微信小程序语音识别探索

背景：最近在做一个旅游相关的工程，其中有微信小程序模块，需求方希望我们在小程序加上语音识别景点的功能，可是小程序并没有支持这个功能，所以小程序的同学就扔给我这个安卓端的来做（笑）

参考资料：

1.http://www.jianshu.com/p/b092da81feb0 本文可以说是在这篇文章的基础上完成的，但一开始遇到了很大的困难（涉及到一个坑下文会提及），学过node.js的同学应该可以做到即插即用，但是本工程使用的是javaweb完成的，还是衷心感谢下作者，虽然不回我私信

2.https://github.com/kn007/silk-v3-decoder 将silk v3转化成wav使用的库，作者十分热心

为了帮助像我这样比较着急完成工程的同学，这次探索过程的苦水我就不倒了，简单粗暴上结果：

在使用微信web开发工具进行调试和真机上使用的时候，录音文件保存的格式是不一样的，本文以这个为分水岭进行介绍：

1.微信web开发者工具（0.18.182200）

总体处理流程（简述）：

本地录音储存文件格式：webm类型的base64字符串

开头指明格式，随后是base64字符串

这里我的处理方法是：

1.忽略前面的类型说明，读入base64字符串

//将微信中的webm格式的base64字符提取出来
BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(file)));
StringBuilder sb = new StringBuilder("");
String temp;
while((temp=reader.readLine())!=null)
{
    sb.append(temp);
}
reader.close();
temp = sb.toString();
int index = temp.indexOf("base64,");
temp = temp.substring(index+7);
System.out.println(temp.substring(0,3));
byte