微信小程序语音识别探索

本文介绍了在微信小程序中实现语音识别的过程,包括处理不同环境下的录音文件格式,如webm转wav和silk-v3转wav。通过ffmpeg进行格式转换,并使用百度语音识别API获取结果。同时分享了遇到的问题,如ffmpeg版本问题和命令路径问题,为开发者提供参考。
摘要由CSDN通过智能技术生成

微信小程序语音识别探索

背景:最近在做一个旅游相关的工程,其中有微信小程序模块,需求方希望我们在小程序加上语音识别景点的功能,可是小程序并没有支持这个功能,所以小程序的同学就扔给我这个安卓端的来做(笑)

参考资料:

1.http://www.jianshu.com/p/b092da81feb0 本文可以说是在这篇文章的基础上完成的,但一开始遇到了很大的困难(涉及到一个坑下文会提及),学过node.js的同学应该可以做到即插即用,但是本工程使用的是javaweb完成的,还是衷心感谢下作者,虽然不回我私信

2.https://github.com/kn007/silk-v3-decoder 将silk v3转化成wav使用的库,作者十分热心

为了帮助像我这样比较着急完成工程的同学,这次探索过程的苦水我就不倒了,简单粗暴上结果:

在使用微信web开发工具进行调试和真机上使用的时候,录音文件保存的格式是不一样的,本文以这个为分水岭进行介绍:

1.微信web开发者工具(0.18.182200)

总体处理流程(简述):

本地录音储存文件格式:webm类型的base64字符串

开头指明格式,随后是base64字符串

这里我的处理方法是:

1.忽略前面的类型说明,读入base64字符串

//将微信中的webm格式的base64字符提取出来
BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(file)));
StringBuilder sb = new StringBuilder("");
String temp;
while((temp=reader.readLine())!=null)
{
    sb.append(temp);
}
reader.close();
temp = sb.toString();
int index = temp.indexOf("base64,");
temp = temp.substring(index+7);
System.out.println(temp.substring(0,3));
byte
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值