微信小程序：nodejs+百度语音识别开发实践

最新推荐文章于 2024-08-07 09:32:48 发布

草灯

最新推荐文章于 2024-08-07 09:32:48 发布

阅读量4.8k

点赞数 4

分类专栏： web前端微信开发小程序文章标签：微信小程序百度语音识别

本文链接：https://blog.csdn.net/eadio/article/details/79000677

版权

本文介绍如何在微信小程序中实现百度语音识别功能。通过Node.js服务端处理微信小程序的AAC录音文件，利用ffmpeg进行音频格式转换，然后使用百度AI SDK进行语音识别。文中详细阐述了安装ffmpeg、创建Express接口、设置appid和appkey等关键步骤，并提供了前端BDSpeechRecognition的代码示例。虽然目前存在ffmpeg转换问题，但已将测试代码上传至码云供参考。

摘要由CSDN通过智能技术生成

今天，终于成功使用nodejs研究出百度语音识别了。目前使用小程序最新录音管理api测试，小程序录音只支持aac，mp3格式，并且保持的是临时地址。而百度语音识别目前只支持pcm，wav，amr格式。因此服务端需要先存储好录音文件并经过一次音频转换。具体步骤如下：

1、安装ffmpeg插件。我使用的windows系统，具体安装方法看这里，该博主文章讲的非常详细，按照步骤走即可。这个插件是使用fluent-ffmpeg依赖的前提条件

2、使用express生成器生成项目开发接口。需要提前安装好几个个依赖：
npm install fluent-ffmpeg –save-dev//mp3转wav依赖
npm install multiparty –save-dev//获取multipart/form-data上传文件依赖
npm install baidu-aip-sdk –save-dev//百度AI依赖

上文提及的申请应用生成的appid和appkey和secretkey仍然需要，具体代码如下：

routes文件夹下创建AiSpeechRecognition.js：：

var express=require('express');
var router=express.Router();
var fs=require('fs');
var Multiparty =require('multiparty');
var ffmpeg=require('fluent-ffmpeg');//创建一个ffmpeg命令
var AipSpeechServer=require('baidu-aip-sdk').speech;

//设置appid/appkey/appsecret
var APP_ID = "申请的应用appid";
var API_KEY = "申请的应用appkey";
var SECRET_KEY = "申请的应用secretkey";

// 新建一个对象，建议只保存一个对象调用服务接口
var client =new AipSpeechServer(APP_ID, API_KEY, SECRET_KEY);
router.post('/recognition', function(req, res, next){
   
  //生成multiparty对象，并配置上传目标路径
  var form =new Multiparty.Form({ uploadDir: './public/audio'});
  //上传完成后处理
  form.parse(req, function(err, fields, files){
   
    var filesTemp=JSON.stringify(files, null, 2);
    if(err){
      //console.log('parse error: '+err);
      res.json({
        ret: -1,
        data:{},
        msg: '未知错误'
      });
    }